Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia
| dc.contributor.advisor | Ferreira, Eric Batista | |
| dc.contributor.author | Figueiredo, Nikolas Neves de | |
| dc.contributor.referee | Teixeira, Josiane Magalhães | |
| dc.contributor.referee | Bueno Filho, Julio Sílvio de Sousa | |
| dc.date.accessioned | 2026-02-25T19:25:36Z | |
| dc.date.available | 2026-02-25T19:25:36Z | |
| dc.date.issued | 2026-02-19 | |
| dc.description.abstract | O presente trabalho investiga a aplicação de modelos estatísticos para a previsão de resultados de partidas do Campeonato Brasileiro de Futebol Série A, com ênfase na comparação de desempenho entre diferentes abordagens metodológicas. A motivação do estudo decorre do histórico vínculo entre probabilidade e jogos, bem como do crescente interesse acadêmico e comercial impulsionado pela popularização das apostas esportivas, especialmente por meio de plataformas digitais. Embora a literatura apresente diversas propostas de modelagem para o futebol, observa-se que, na maioria dos casos, as taxas de acerto raramente ultrapassam 60% e, quando o fazem, tendem a perder consistência em aplicações de longo prazo. Foram analisados 35 modelos distintos, originados a partir de dois métodos amplamente reconhecidos na literatura e de variações metodológicas propostas neste trabalho. Os modelos foram avaliados com base em onze métricas, buscando captar as particularidades de cada abordagem. Essas métricas mensuram acurácia, erro, calibração probabilística, nível de complexidade, além de critérios adicionais destinados a aferir robustez e aplicabilidade prática. Uma atenção especial foi dada à parcimônia dos modelos e ao equilíbrio entre simplicidade e desempenho. O estudo também incorporou a análise do impacto de diferentes janelas temporais, definidas em função do número de rodadas anteriores consideradas na geração das previsões. Dessa forma, o desempenho dos modelos variou de acordo com as métricas empregadas, mas alguns se destacaram de forma clara. Entre eles, os modelos UfmgGer e Sd1Ger apresentaram os melhores resultados globais, enquanto o modelo ConTeiMan surpreendeu por sua metodologia extremamente simples aliada a uma elevada taxa de acerto. | |
| dc.description.abstract2 | The present study investigates the application of statistical models for predicting the outcomes of matches in the Brazilian Série A Football Championship, with an emphasis on comparing performance across different methodological approaches. The motivation for this research stems from the historical link between probability theory and games, as well as from the growing academic and commercial interest driven by the popularization of sports betting, particularly through digital platforms. Although the literature presents a wide range of modeling proposals for football, it is observed that, in most cases, prediction accuracy rates rarely exceed 60\%, and when they do, they tend to lose consistency in long-term applications. A total of 35 distinct models were analyzed, derived from two methods widely recognized in the literature and from methodological variations proposed in this study. The models were evaluated based on eleven metrics, aiming to capture the specific characteristics of each approach. These metrics assess accuracy, error, probabilistic calibration, and model complexity, in addition to further criteria designed to evaluate robustness and practical applicability. Special attention was given to model parsimony and to the balance between simplicity and performance. The study also incorporated an analysis of the impact of different temporal windows, defined according to the number of previous rounds considered in generating the predictions. As a result, model performance varied depending on the metrics employed, although some models clearly stood out. Among them, the UfmgGer and Sd1Ger models achieved the best overall results, while the ConTeiMan model was notable for its extremely simple methodology combined with a high prediction accuracy. | |
| dc.description.additionalinformation | Termo SEI 1732759 | |
| dc.description.physical | 110 | |
| dc.description.sponsorship | Coordenação de Aperfeiçoamento de Pessoal de Nível Superior – CAPES | |
| dc.identifier.credential | 2023.2.214.002 | |
| dc.identifier.lattesAdvisor | http://lattes.cnpq.br/9965398009651936 | |
| dc.identifier.lattesAuthor | http://lattes.cnpq.br/3128218938439663 | |
| dc.identifier.orcidAdvisor | https://orcid.org/0000-0003-3361-0908 | |
| dc.identifier.orcidAuthor | https://orcid.org/0000-0003-4911-7245 | |
| dc.identifier.uri | https://repositorio.unifal-mg.edu.br/handle/123456789/3322 | |
| dc.language.iso | pt | |
| dc.publisher.campi | Sede | |
| dc.publisher.course | Mestrado em Estatística Aplicada e Biometria | |
| dc.publisher.department | Instituto de Ciências Exatas | |
| dc.publisher.initials | UNIFAL-MG | |
| dc.publisher.institution | Universidade Federal de Alfenas | |
| dc.publisher.program | Programa de Pós-Graduação em Estatística Aplicada e Biometria | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.subject.cnpq | Ciências Exatas e da Terra | |
| dc.subject.en | Sports forecasting | |
| dc.subject.en | Sports betting | |
| dc.subject.en | Statistical modeling | |
| dc.subject.pt-BR | Previsão esportiva | |
| dc.subject.pt-BR | Aposta esportiva | |
| dc.subject.pt-BR | Modelagem estatística | |
| dc.title | Modelagem estatística e o limite da predição no futebol brasileiro: um estudo comparativo de desempenho e parcimônia | |
| dc.title.alternative | Statistical Modeling and the Limits of Prediction in Brazilian Football: A Comparative Study of Performance and Parsimony | |
| dc.type | info:eu-repo/semantics/masterThesis |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Dissertação de Nikolas Neves de Figueiredo.pdf
- Tamanho:
- 7.38 MB
- Formato:
- Adobe Portable Document Format
Licença do Pacote
1 - 1 de 1
Nenhuma Miniatura disponível
- Nome:
- license.txt
- Tamanho:
- 1.89 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição:
