Adaptação do XGBOOST para suporte à classificação de fluxos de dados com mudanças de conceito recorrentes

Tipo de documento

Monografia

Data

2024

Modalidade de acesso

Acesso aberto

Centro

CCT

Instituição

Programa

Área do conhecimento

Ciências Exatas e da Terra

Editora

Autor

Correa, Yuji Yamada

Orientador

Coorientador

Projetos de Pesquisa

Unidades Organizacionais

Fascículo

Resumo

A popularização de tecnologias de sensoriamento e conectividade, como o 5G e a Internet das Coisas (IoT), tem impulsionado um aumento significativo na geração de fluxos de dados. Esses fluxos representam sequências contínuas e ilimitadas de informações, geradas em alta frequência. Como resultado, a demanda por algoritmos de aprendizado de máquina capazes de extrair padrões desses dados e prever rótulos para novas instâncias do fluxo tem crescido consideravelmente. Um dos principais desafios na classificação de fluxos de dados é a presença de mudanças de conceito, que podem ser categorizadas em quatro tipos: abruptas, graduais, incrementais e recorrentes. Embora as mudanças de conceito recorrentes sejam frequentemente observadas em aplicações do mundo real, elas ainda são pouco exploradas na literatura, deixando uma lacuna no desenvolvimento de técnicas específicas para lidar com esse tipo de mudança. Dessa forma, este trabalho propõe a seguinte pergunta de pesquisa: Como adaptar um algoritmo para suportar a classificação em fluxos de dados de forma rápida, ao mesmo tempo em que lida ativamente com a ocorrência de mudanças de conceito recorrentes?

Abstract

The popularization of sensing and connectivity technologies, such as 5G and the Internet of Things (IoT), has driven a significant increase in the generation of data streams. These streams represent continuous and unlimited sequences of information, generated at high frequency. As a result, the demand for machine learning algorithms capable of extracting patterns from these data and predicting labels for new instances of the stream has grown considerably. One of the main challenges in classifying data streams is the presence of concept changes, which can be categorized into four types: abrupt, gradual, incremental, and recurrent. Although recurrent concept changes are frequently observed in real-world applications, they are still little explored in the literature, leaving a gap in the development of specific techniques to deal with this type of change. Thus, this work proposes the following research question: How to adapt an algorithm to support classification in data streams quickly, while actively dealing with the occurrence of recurrent concept changes?

Citação

DOI

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como Attribution-NonCommercial-ShareAlike 4.0 Brazil