Adaptação do XGBOOST para suporte à classificação de fluxos de dados com mudanças de conceito recorrentes
Arquivos
Tipo de documento
Monografia
Data
2024
Modalidade de acesso
Acesso aberto
Centro
CCT
Instituição
Programa
Área do conhecimento
Ciências Exatas e da Terra
Editora
Autor
Correa, Yuji Yamada
Orientador
Coorientador
Resumo
A popularização de tecnologias de sensoriamento e conectividade, como o 5G e a Internet das Coisas (IoT), tem impulsionado um aumento significativo na geração de fluxos de dados. Esses fluxos representam sequências contínuas e ilimitadas de informações, geradas em alta frequência. Como resultado, a demanda por algoritmos de aprendizado de máquina capazes de extrair padrões desses dados e prever rótulos para novas instâncias do fluxo tem crescido consideravelmente. Um dos principais desafios na classificação de fluxos de dados é a presença de mudanças de conceito, que podem ser categorizadas em quatro tipos: abruptas, graduais, incrementais e recorrentes. Embora as mudanças de conceito recorrentes sejam frequentemente observadas em aplicações do mundo real, elas ainda são pouco exploradas na literatura, deixando uma lacuna no desenvolvimento de técnicas específicas para lidar com esse tipo de mudança. Dessa forma, este trabalho propõe a seguinte pergunta de pesquisa: Como adaptar um algoritmo para suportar a classificação em fluxos de dados de forma rápida, ao mesmo tempo em que lida ativamente com a ocorrência de mudanças de conceito recorrentes?
Abstract
The popularization of sensing and connectivity technologies, such as 5G and the Internet of Things (IoT), has driven a significant increase in the generation of data streams. These streams represent continuous and unlimited sequences of information, generated at high frequency. As a result, the demand for machine learning algorithms capable of extracting patterns from these data and predicting labels for new instances of the stream has grown considerably. One of the main challenges in classifying data streams is the presence of concept changes, which can be categorized into four types: abrupt, gradual, incremental, and recurrent. Although recurrent concept changes are frequently observed in real-world applications, they are still little explored in the literature, leaving a gap in the development of specific techniques to deal with this type of change. Thus, this work proposes the following research question: How to adapt an algorithm to support classification in data streams quickly, while actively dealing with the occurrence of recurrent concept changes?
Palavras-chave
Citação
DOI
URL permanente
Avaliação
Revisão
Suplementado Por
Referenciado Por
Licença Creative Commons
Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution-NonCommercial-ShareAlike 4.0 Brazil