Análise de desempenho de modelos supervisionados aplicados à classificação multirrótulo
| dc.contributor.advisor | Souza, Mariane Moreira de | |
| dc.contributor.author | Lopes, Assucena Quéren | |
| dc.contributor.referee | Costa, Isabelle Cristinne Pinto Sampaio | |
| dc.contributor.referee | Almeida, Rafael José de Alencar | |
| dc.date.accessioned | 2025-12-29T10:51:54Z | |
| dc.date.available | 2025-12-29T10:51:54Z | |
| dc.date.issued | 2025-12-15 | |
| dc.description.abstract | Este trabalho investiga o desempenho de diferentes algoritmos supervisionados aplicados à classificação multirrótulo, com foco em compreender como modelos tradicionais se comportam quando avaliados de forma comparativa e estatisticamente fundamentada. Foram analisados cinco classificadores amplamente utilizados na literatura, XGBoost, Random Forest, Multilayer Perceptron, Regressão Logística e k-Nearest Neighbors, todos adaptados à abordagem Binary Relevance e avaliados em múltiplas métricas relevantes para cenários multirrótulo.Os resultados evidenciaram diferenças consistentes entre os modelos. O XGBoost apresentou desempenho elevado em métricas sensíveis ao equilíbrio entre rótulos, como F1-macro e Hamming Loss, destacando-se por sua capacidade de capturar relações complexas entre atributos. O Random Forest obteve os valores mais altos em métricas influenciadas por frequências de rótulos, como F1-micro e Jaccard, refletindo sua estabilidade em cenários com classes majoritárias. O Multilayer Perceptron apresentou desempenho intermediário e maior variabilidade entre execuções, enquanto Regressão Logística e k-NN foram sistematicamente inferiores aos demais modelos. Os resultados obtidos indicam que determinados modelos apresentaram desempenho mais consistente do que outros no contexto específico desta investigação, considerando as métricas avaliadas e as características da base Yeast. Conclui-se que esses dois métodos constituem alternativas mais eficazes para classificação multirrótulo no conjunto avaliado, cada qual apresentando vantagens específicas conforme o critério de desempenho adotado. | |
| dc.description.abstract2 | This work presents a comparative study of traditional supervised learning algorithms applied to the multilabel classification problem using the Yeast dataset. The objective is to evaluate how different models behave in a scenario characterized by label imbalance and complex multirrelational dependencies. Five algorithms were analyzed (XGBoost, Random Forest, Multilayer Perceptron, Logistic Regression, and k-Nearest Neighbors) using the Binary Relevance transformation and One-vs-Rest estimation scheme. Each model underwent hyperparameter optimization based on cross-validation and metric-specific threshold selection. Afterward, the best configurations were evaluated over 50 repetitions with different random seeds to assess stability and robustness. The results indicate that performance varies depending on the evaluation metric: XGBoost stands out in F1-macro and Hamming Loss, while Random Forest performs better in F1-micro and Jaccard. These findings highlight how different learning biases influence model behavior in multilabel settings and reinforce the importance of comprehensive evaluation using multiple metrics. The study thus contributes to a deeper understanding of model performance in multilabel classification and provides empirical evidence useful for future studies and methodological improvements. | |
| dc.description.additionalinformation | Termo de autorização SEI 1700960 | |
| dc.description.physical | 57 | |
| dc.identifier.credential | 2022.1.08.027 | |
| dc.identifier.lattesAuthor | http://lattes.cnpq.br/4044734258074125 | |
| dc.identifier.uri | https://repositorio.unifal-mg.edu.br/handle/123456789/3247 | |
| dc.language.iso | pt | |
| dc.publisher.campi | Unidade Santa Clara | |
| dc.publisher.course | Ciência da Computação | |
| dc.publisher.department | Instituto de Ciências Exatas | |
| dc.publisher.initials | UNIFAL-MG | |
| dc.publisher.institution | Universidade Federal de Alfenas | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.rights.creativeCommons | Attribution-NoDerivs 3.0 Brazil | en |
| dc.rights.uri | http://creativecommons.org/licenses/by-nd/3.0/br/ | |
| dc.subject.cnpq | Ciências Exatas e da Terra::Ciência da Computação::Matemática da Computação::Modelos Analíticos e de Simulação | |
| dc.subject.en | Multilabel classification | |
| dc.subject.en | Supervised learning | |
| dc.subject.en | Model comparison | |
| dc.subject.en | Evaluation metrics | |
| dc.subject.en | Machine learning | |
| dc.subject.pt-BR | Classificação multirrótulo | |
| dc.subject.pt-BR | Avaliação de modelos | |
| dc.subject.pt-BR | Aprendizado de máquina | |
| dc.subject.pt-BR | Análise comparativa | |
| dc.title | Análise de desempenho de modelos supervisionados aplicados à classificação multirrótulo | |
| dc.type | info:eu-repo/semantics/bachelorThesis |
