Aplicação da classificação multi-class em decisões monocráticas do Supremo Tribunal Federal
Tipo de documento
Monografia
Data
2019
Modalidade de acesso
Acesso aberto
Centro
CEAVI
Instituição
Programa
Área do conhecimento
Ciências Exatas e da Terra
Editora
Autor
Machado, Felipe Lana
Orientador
Márcio José Mantau
Coorientador
Resumo
Este trabalho apresenta um estudo que começa na mineração, preparação e processamento de dados até o treinamento e verificação estatística dos resultados. Sendo que, o objetivo do trabalho é apresentar uma alternativa à forma como as decisões monocráticas do Supremo Tribunal Federal são classificadas em assuntos, de forma a automatizar em partes este trabalho que hoje é realizado de forma manual. Para isso, foram utilizadas três arquiteturas distintas, sendo duas redes neurais CNN e o BERT. Após o treinamento, foram realizados dois experimentos, um gerando 50 resultados distintos composto pela acurácia, precisão, sensibilidade e F1-Score para cada um dos modelos. E outro experimento utilizando todos os dados disponibilizados para teste, que gerou uma matriz binária onde é representado os acertos e erros para cada uma das decisões em cada um dos modelos. Por fim, foram realizado quatro testes estatísticos que permitiram dizer qual dos modelos apresentou a melhor performance e como estes resultados se comparam a outros trabalhos correlatos.
Abstract
This paper presents a study that begins in the mining, preparation and processing of data until the training and statistical verification of the results. The objective of this paper is to present an alternative to the way the monocratic decisions of the Federal Supreme Court are classified in subjects, in order to automate in part this work that is done manually today. For this, three different architectures were used, two neural networks CNN, LSTM and the BERT. After training, two experiments were performed, one yielding 50 distinct results composed by the accuracy, precision, sensitivity and F1-Score for each of the models. And another experiment using all the data available for testing, which generated a binary matrix where the hits and misses for each decision in each model is represented. Finally, four statistical tests were performed which allowed us to say which of the models presented the best performance and how these results compare to other related works.
Palavras-chave
Citação
DOI
URL permanente
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution-NonCommercial-ShareAlike 4.0 Brazil