Comment analyser une course de chevaux ?

En plus des courses de lévriers, des combats de poissons et de la législation 2017, les courses de chevaux sont les compétitions animales les plus populaires pour les parieurs.

Le foin du hasard, l’entraînement et la sélection génétique de ces grands animaux permettent au sage parieur d’apprécier quel cheval arrivera en premier. Comment pouvez-vous gagner dans les courses de chevaux ?

A découvrir également : Comment fonctionne les 100 euros Betclic ?

Pourquoi est-il difficile de gagner dans les courses ?

Pour faire des crêpes réussies, il est nécessaire de maîtriser 3 éléments : farine, oeuf, lait. C’est dur de se tromper.

Pour réussir dans les courses, il est nécessaire de prendre en compte plus d’une douzaine d’éléments très complexes :

A lire en complément : Comment les application gratuite gagnent de l'argent ?

En outre, une course est une compétition, les positions cibles reflètent non seulement la performance d’un cheval particulier, mais aussi la performance comparative de 6, 10 ou 25 chevaux différents ! Comprendre et maîtriser ces différents facteurs (jockey, coach, numéro de corde…) peut prendre des années.

Parlons maintenant de statistiques…

Analyser des dizaines de variables différentes pour décrire un système aléatoire complexe est plus ou moins ce sur quoi je travaille depuis plus de 10 ans.

Comment l’analyse statistique, couplée à l’intelligence artificielle, répond-elle, si je lui demande de prédire les résultats de la course de chevaux ?

Après m’être documenté sur les courses de chevaux (voir ce lexique), j’ai d’abord recueilli les résultats des courses passées :

De 2011 à 2017, 11 498 coursesou plus de 169 740 arrivées de chevaux ont été enregistrées, avec toutes les informations disponibles : musique, clignotants, jockey, distance, type de sol, etc…

Commençons par les variables suivantes à :

  1. le jockey
  2. l’ entraîneur
  3. le numéro de la corde
  4. la notation
  5. la base du prévisionniste
  6. l’ ensemble du prévisionniste
  7. le poids total
  8. la position dans la dernière course
  9. la position moyenne des 3 dernières courses
  10. la position moyenne des 5 dernières courses

Les principaux points de l’algorithme sont :

  • Utiliserdes valeurs relatives  : Ce n’est pas la probabilité d’un cheval qui compte, mais ses chances par rapport aux autres chevaux de la course. Par exemple, si les dimensions sont 1, 5, 7, 10, elles sont remplacées par (dimension max (dimension))/(max (dimension) -min (dimension)) = 1, 0,55, 0,33, 0.
  • normaliser les variables : chaque variable (clignotant, position…) est convertie en fraction de course placée . Par exemple, si le cheval n’a pas de clignotant, nous utiliserons cette variable convertir aveugle dans la probabilité qu’un cheval sera placé s’il ne porte pas de oeillères.
  • Tous les chevaux sont a priori en premier, parce que tout le monde peut terminer la course. Seule la présence d’autres chevaux détermine la position finale.

Ces 10 variables sont ensuite données à une méthode d’intelligence artificielle appeléeGradient Boosted Machine. Cette méthode vise à classer les différents chevaux des races passées, en appliquant des critères pour chaque variable. Un total de 1000 sélections différentes (appelées arbre de décision ) sont définies et combinées pour obtenir un outil permettant de prédire la position de chaque cheval. Cette méthode de Gradient Boosted Machine a été choisie compte tenu du grand nombre de courses disponibles, de la flexibilité et de la vitesse de cette méthode. Les différents paramètres ont été optimisés pour fournir la prédiction la plus précise.

Toutes les variables n’ont pas la même importance, les deux graphiques suivants indiquent l’importance relative de chaque parent pour les 10 variables (à droite), et si nous n’avons pas la cote pour les chevaux (à gauche) :

Les opportunités et les prévisionnistes sont les variables les plus importantes, suivies par le numéro de chaîne, le jockey et l’entraîneur. Il est intéressant de noter que l’entraîneur est tout aussi important que le jockey.

Prévisions statistiques des arrivées de course

Considérez les chevaux que mon analyse donne gagnants, c’est-à-dire avec une position cible 1 (voir tableau ci-dessous), le cheval arrive premier dans 27% des cas et est placé dans 61% des cas.

Pas mal, mais y a-t-il des situations où cette prédiction est encore meilleure ? Regardons les variables différemment… Les graphiques que vous verrez sont appelés « boxplots ». La barre noire représente le moyenne de la population présentée, et la boîte bleue représente 50 % de cette population.

L’ âge du cheval

Commençons par l’âge, les chevaux de moins de 4 ans semblent plus faciles à prédire que leurs aînés, la probabilité de gagner le cheval est alors de 33% et elle est de 71% :

oeillères

En tant qu’accessoire nécessaire pour les chevaux trop nerveux, il semble que les chevaux sans clignotants soient en fait plus faciles à prévoir, avec une probabilité de 29% de victoire et une probabilité de 68% :

Les 10 dernières courses du cheval

Considérez la position moyenne des 10 dernières courses, il est clairement observé que les chevaux ayant une position moyenne inférieure à 4 ont plus de chances de gagner : 33% viennent en premier et 69% doivent être placés :

Heure de la course

Passons à l’environnement de course avec l’heure de départ. Les chevaux de course sont des créatures très sensibles et nerveuses qui préfèrent clairement les courses le matin et le soir :

Le mois de la course

Il en va de même pour les mois de l’année : les jours froids d’hiver et les chaudes journées d’été n’aiment pas les chevaux.

Il est clair que les chevaux se sentent mieux au printemps et en automne et sont plus faciles à prévoir :

La distance totale de la course

Une course est un événement gonflable, plus il est long, plus il est probable que le favori lui-même volera la 1ère place sous le museau. Cela rend le plus facile de prédire des courses de moins de 1400 m

fin de compte, dans la situation optimale d’un cheval de moins de 3 ans, sans oeillères, qui en moyenne dans les 10 dernières courses placé et courir sur une distance inférieure à 1400 m, la probabilité d’être prédit correctement augmente à 83%, tandis que la probabilité d’être correctement prédit augmente à 93 % En .

Performances par rapport aux paris standard comme la plateforme Zeturf :

Nom du pari Description Probabilité
sg Revenu 29,8%
sp Simple Placé 94.2%
tr Trio dans le désordre 11,8%
tri Trio dans l’ordre 2,7%
zs Zweites 19%
zc Quatrième 13,6%
Jgg Jumeaux Gagnants 14,1%
jgp Jumeaux placés 31,2%
z24 Jumeaux Plakate dans les 4 89,9%
z4 4 Premieren dans Chaos 12,7%
z5 Top 5 im Chaos 16,4%
s4 4 paris simples 94,3%
ju 2 top de 7.7%
ze234 combinaison de 3 paris 27,1%
e345 combinaison de 3 paris 26,9%

trouve

De nombreuses études ont tenté de prédire l’arrivée des chevaux de course, mais ils souffrent généralement :

  • un certain amateurisme : souvent un travail étudiant, de qualité mais trop temporaire
  • d’ un manque de données, j’ai l’information sur 11 498 courses
  • le manque de traitement des données
  • l’ hypothèse que la position d’un cheval est une valeur absolue

L’ outil statistique présenté ici semble être en mesure de prédire avec un taux de réussite élevé si un cheval sera placé ou non. Toutefois, cette analyse reste provisoire et d’importantes améliorations peuvent être apportées (météo, tendance des chevaux, etc.).

Si vous avez un commentaire ou une question, n’hésitez pas à me contacter par e-mail.

13 juin 2017 XavierCaudent