Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia

dc.contributor.advisorFerreira, Eric Batista
dc.contributor.authorFigueiredo, Nikolas Neves de
dc.contributor.refereeTeixeira, Josiane Magalhães
dc.contributor.refereeBueno Filho, Julio Sílvio de Sousa
dc.date.accessioned2026-02-25T19:25:36Z
dc.date.available2026-02-25T19:25:36Z
dc.date.issued2026-02-19
dc.description.abstractO presente trabalho investiga a aplicação de modelos estatísticos para a previsão de resultados de partidas do Campeonato Brasileiro de Futebol Série A, com ênfase na comparação de desempenho entre diferentes abordagens metodológicas. A motivação do estudo decorre do histórico vínculo entre probabilidade e jogos, bem como do crescente interesse acadêmico e comercial impulsionado pela popularização das apostas esportivas, especialmente por meio de plataformas digitais. Embora a literatura apresente diversas propostas de modelagem para o futebol, observa-se que, na maioria dos casos, as taxas de acerto raramente ultrapassam 60% e, quando o fazem, tendem a perder consistência em aplicações de longo prazo. Foram analisados 35 modelos distintos, originados a partir de dois métodos amplamente reconhecidos na literatura e de variações metodológicas propostas neste trabalho. Os modelos foram avaliados com base em onze métricas, buscando captar as particularidades de cada abordagem. Essas métricas mensuram acurácia, erro, calibração probabilística, nível de complexidade, além de critérios adicionais destinados a aferir robustez e aplicabilidade prática. Uma atenção especial foi dada à parcimônia dos modelos e ao equilíbrio entre simplicidade e desempenho. O estudo também incorporou a análise do impacto de diferentes janelas temporais, definidas em função do número de rodadas anteriores consideradas na geração das previsões. Dessa forma, o desempenho dos modelos variou de acordo com as métricas empregadas, mas alguns se destacaram de forma clara. Entre eles, os modelos UfmgGer e Sd1Ger apresentaram os melhores resultados globais, enquanto o modelo ConTeiMan surpreendeu por sua metodologia extremamente simples aliada a uma elevada taxa de acerto.
dc.description.abstract2The present study investigates the application of statistical models for predicting the outcomes of matches in the Brazilian Série A Football Championship, with an emphasis on comparing performance across different methodological approaches. The motivation for this research stems from the historical link between probability theory and games, as well as from the growing academic and commercial interest driven by the popularization of sports betting, particularly through digital platforms. Although the literature presents a wide range of modeling proposals for football, it is observed that, in most cases, prediction accuracy rates rarely exceed 60\%, and when they do, they tend to lose consistency in long-term applications. A total of 35 distinct models were analyzed, derived from two methods widely recognized in the literature and from methodological variations proposed in this study. The models were evaluated based on eleven metrics, aiming to capture the specific characteristics of each approach. These metrics assess accuracy, error, probabilistic calibration, and model complexity, in addition to further criteria designed to evaluate robustness and practical applicability. Special attention was given to model parsimony and to the balance between simplicity and performance. The study also incorporated an analysis of the impact of different temporal windows, defined according to the number of previous rounds considered in generating the predictions. As a result, model performance varied depending on the metrics employed, although some models clearly stood out. Among them, the UfmgGer and Sd1Ger models achieved the best overall results, while the ConTeiMan model was notable for its extremely simple methodology combined with a high prediction accuracy.
dc.description.additionalinformationTermo SEI 1732759
dc.description.physical110
dc.description.sponsorshipCoordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPES
dc.identifier.credential2023.2.214.002
dc.identifier.lattesAdvisorhttp://lattes.cnpq.br/9965398009651936
dc.identifier.lattesAuthorhttp://lattes.cnpq.br/3128218938439663
dc.identifier.orcidAdvisorhttps://orcid.org/0000-0003-3361-0908
dc.identifier.orcidAuthorhttps://orcid.org/0000-0003-4911-7245
dc.identifier.urihttps://repositorio.unifal-mg.edu.br/handle/123456789/3322
dc.language.isopt
dc.publisher.campiSede
dc.publisher.courseMestrado em Estatística Aplicada e Biometria
dc.publisher.departmentInstituto de Ciências Exatas
dc.publisher.initialsUNIFAL-MG
dc.publisher.institutionUniversidade Federal de Alfenas
dc.publisher.programPrograma de Pós-Graduação em Estatística Aplicada e Biometria
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subject.cnpqCiências Exatas e da Terra
dc.subject.enSports forecasting
dc.subject.enSports betting
dc.subject.enStatistical modeling
dc.subject.pt-BRPrevisão esportiva
dc.subject.pt-BRAposta esportiva
dc.subject.pt-BRModelagem estatística
dc.titleModelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
dc.title.alternativeStatistical Modeling and the Limits of Prediction in Brazilian Football: A Comparative Study of Performance and Parsimony
dc.typeinfo:eu-repo/semantics/masterThesis

Arquivos

Pacote Original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação de Nikolas Neves de Figueiredo.pdf
Tamanho:
7.38 MB
Formato:
Adobe Portable Document Format

Licença do Pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.89 KB
Formato:
Item-specific license agreed upon to submission
Descrição: