Aplicação da classificação multi-class em decisões monocráticas do Supremo Tribunal Federal

Tipo de documento

Monografia

Data

2019

Modalidade de acesso

Acesso aberto

Centro

CEAVI

Instituição

Programa

Área do conhecimento

Ciências Exatas e da Terra

Editora

Autor

Machado, Felipe Lana

Orientador

Márcio José Mantau

Coorientador

Projetos de Pesquisa

Unidades Organizacionais

Fascículo

Resumo

Este trabalho apresenta um estudo que começa na mineração, preparação e processamento de dados até o treinamento e verificação estatística dos resultados. Sendo que, o objetivo do trabalho é apresentar uma alternativa à forma como as decisões monocráticas do Supremo Tribunal Federal são classificadas em assuntos, de forma a automatizar em partes este trabalho que hoje é realizado de forma manual. Para isso, foram utilizadas três arquiteturas distintas, sendo duas redes neurais CNN e o BERT. Após o treinamento, foram realizados dois experimentos, um gerando 50 resultados distintos composto pela acurácia, precisão, sensibilidade e F1-Score para cada um dos modelos. E outro experimento utilizando todos os dados disponibilizados para teste, que gerou uma matriz binária onde é representado os acertos e erros para cada uma das decisões em cada um dos modelos. Por fim, foram realizado quatro testes estatísticos que permitiram dizer qual dos modelos apresentou a melhor performance e como estes resultados se comparam a outros trabalhos correlatos.

Abstract

This paper presents a study that begins in the mining, preparation and processing of data until the training and statistical verification of the results. The objective of this paper is to present an alternative to the way the monocratic decisions of the Federal Supreme Court are classified in subjects, in order to automate in part this work that is done manually today. For this, three different architectures were used, two neural networks CNN, LSTM and the BERT. After training, two experiments were performed, one yielding 50 distinct results composed by the accuracy, precision, sensitivity and F1-Score for each of the models. And another experiment using all the data available for testing, which generated a binary matrix where the hits and misses for each decision in each model is represented. Finally, four statistical tests were performed which allowed us to say which of the models presented the best performance and how these results compare to other related works.

Citação

DOI

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution-NonCommercial-ShareAlike 4.0 Brazil