PREVISÃO DE RESULTADOS NO UTEBOL

[Pages:105]CENTRO FEDERAL DE EDUCA??O TECNOL?GICA DE MINAS GERAIS PROGRAMA DE P?S-GRADUA??O EM MODELAGEM MATEM?TICA E COMPUTACIONAL

PREVIS?O DE RESULTADOS NO FUTEBOL POR MEIO DE T?CNICAS DE APRENDIZADO

DE M?QUINA

FELIPE AUGUSTO PEREIRA FERNANDES

Orientador: Fl?vio Vin?cius Cruzeiro Martins Centro Federal de Educa??o Tecnol?gica de Minas Gerais

Coorientador: An?sio Mendes Lacerda Centro Federal de Educa??o Tecnol?gica de Minas Gerais

BELO HORIZONTE FEVEREIRO DE 2019

FELIPE AUGUSTO PEREIRA FERNANDES

PREVIS?O DE RESULTADOS NO FUTEBOL POR MEIO DE T?CNICAS DE APRENDIZADO DE M?QUINA

Disserta??o apresentado ao Programa de P?s-gradua??o em Modelagem Matem?tica e Computacional do Centro Federal de Educa??o Tecnol?gica de Minas Gerais, como requisito parcial para a obten??o do t?tulo de Mestre em Modelagem Matem?tica e Computacional.

?rea de concentra??o: Modelagem Matem?tica e Computacional

Linha de pesquisa: Sistemas Inteligentes

Orientador:

Fl?vio Vin?cius Cruzeiro Martins Centro Federal de Educa??o Tecnol?gica de Minas Gerais

Coorientador: An?sio Mendes Lacerda Centro Federal de Educa??o Tecnol?gica de Minas Gerais

CENTRO FEDERAL DE EDUCA??O TECNOL?GICA DE MINAS GERAIS PROGRAMA DE P?S-GRADUA??O EM MODELAGEM MATEM?TICA E COMPUTACIONAL

BELO HORIZONTE FEVEREIRO DE 2019

i

Dedico tamb?m aos portadores de doen?as auto-imunes, em especial aos portadores da Doen?a de Chron. Apesar de toda a dificuldade e sofrimento, ainda podemos sonhar e batalhar para alcan?ar nossos objetivos. A vida vale a pena ser vivida!

iii

Agradecimentos

Agrade?o aos meus pais, Adilson Jos? Fernandes e Maria da Penha Pereira Fernandes, e minha irm?, Bruna Regina Pereira Fernandes, por todo amor, carinho e compreens?o que tiveram comigo durante toda a minha vida.

Tamb?m agrade?o ? Patr?cia Sette C?mara Haizer, que me apoiou e teve muita paci?ncia comigo nessa jornada.

Agrade?o aos professores que tive no CEFETMG, tanto na gradua??o como no mestrado, pois me serviram de exemplo e inspira??o acad?mica.

Agrade?o aos meus amigos que me apoiaram e me incentivaram durante todos os momentos dif?ceis, alguns com palavras incentivadoras e outros com belas risadas.

Agrade?o meu orientador, Fl?vio Vin?cius Cruzeiro Martins, e meu co-orientador, An?sio Lacerda, pela compreens?o e ajuda ao longo do estudo.

Agrade?o tamb?m ? CAPES, ao CNPq e ? FAPEMIG pelo apoio financeiro.

iv

"Walk on, Walk on With hope in your heart And you'll never walk alone" (You'll Never Walk Alone, Compositores: Oscar Hammerstein li / Richard Rodgers)

v

Resumo

Futebol ? considerado o esporte mais popular do mundo. Por isso, existe um grande interesse em saber quem ser? o vencedor de uma partida com impactos sociais e econ?micos ao redor do mundo. A partir de dados b?sicos de desempenho, extra?dos dos placares dos jogos, este trabalho tem o objetivo de estudar o desempenho dos algoritmos de aprendizado de m?quina aplicados ? predi??o de jogos de futebol: vit?ria do mandante, empate ou vit?ria do visitante. Propusemos um modelo de dados para predi??o de jogos de futebol e investigamos os modelos de aprendizado com tarefas de regress?o e classifica??o aplicando t?cnicas de redu??o de dimens?o. Os algoritmos utilizados para regress?o foram: Regress?o Linear (RegLin), K vizinhos mais pr?ximos (KNN), Random Forest (RF) e Gradient Boosting (GB). Para classifica??o: Regress?o Log?stica (RegLog), Random Forest (RF), Gradient Boosting (GB), Naive Bayes (NB) e K vizinhos mais pr?ximos. Para os algoritmos de regress?o, o valor refer?ncia passou a ser o saldo de gols, pois ? um n?mero inteiro que varia num intervalo . O melhor algoritmo, em rela??o ao F1-score, foi o GB aplicado a tarefa de regress?o utilizando o modelo proposto neste estudo com K igual a 0.25. Este modelo apresentou um F1-score de 0.509 e uma acur?cia de 52.78%. Aplicando esse modelo em apostas esportivas, ele se mostrou robusto em rela??o a lucratividade, com rentabilidade superior a ?ndices de refer?ncia como IBOV e a taxa b?sica de juros do Brasil, a taxa SELIC. Palavras-chave: Futebol, Predi??o, Aprendizado de M?quina, Predi??o de jogos de Futebol, Apostas.

vi

Abstract

Football is considered the most popular sport in the world. Therefore, there is a great interest in knowing who will be the winner of a match with social and economic impacts around the world. Based on basic performance data, extracted from game scores, this work has the objective of studying the performance of machine learning algorithms applied to soccer game prediction: victory of home team, draw or victory of the visitor. We propose a data model to predict soccer games and investigate machine learning models with regression and classification tasks applying size reduction techniques. The algorithms used for regression were: Linear Regression (RegLin), K-neighbors (KNN), Random Forest RF and Gradient Boosting (GB). For classification: Logistic Regression (RegLog), Random Forest (RF), Gradient Boosting (GB), Naive Bayes (NB), and K-nearest neighbors (KNN). For the regression algorithms, the reference value became the goal difference. To map the predicted goal difference to one of our classes, we create a function that receives the predicted goal difference and a parameter K that must be set. If predicted goal difference is: greater than K then the is home team victory; less than K then predicted class is away team victory; otherwise the class is draw. The best algorithm, considering F1-score, was the GB applied to the regression task using the model proposed in this study with K equal to 0.25. This model had an F1-score of 0.509 and an accuracy of 52.78%. Applying the best model in sports betting it proved to be robust in terms of profitability, with better profitability higher than benchmark indices such as IBOV and the Brazilian interest rate, SELIC. Keywords: Soccer, Football, Machine Learning, Football Prediction, Bet, Soccer Betting

vii

................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download