La semaine dernière, j’ai découvert que le site de l’Australian Open via son partenaire Infosys propose des données ultra-détaillées pour chaque match. Bien plus que l’ATP tour que je prend souvent comme source.
On retrouve notamment le détail de chaque point joué :
👉 le vainqueur du point,
👉 le score : jeux et set
👉 un commentaire sur le déroulé du point.

Mon objectif de la semaine était donc de récupérer ces données.
Exemple de page source : https://lnkd.in/gR9JZ9HV
Premier essai : essayer de scrapper les pages de chaque match pour extraire les données.
Resultat : zéro… nada… niente… 🫠
Deuxième test, en fouillant dans la page, j’ai découvert une URL qui me renvoie vers un JSON avec toutes les données que je recherche ! 😱
Quelle surprise de voir que l’accès est complètement ouvert… Pas de mots de passe, pas de clé API! Un régal! Mais on est d’accord que ce n’est pas trop normal ça non ? 😅
Je récupère l’appel API pour chaque page de chaque match et je récupère en masse tous les JSON dont j’ai extrait les données qui m’intéressaient !
Résultats : j’ai aujourd’hui un export de 33270 lignes ! 1 ligne = 1 point joué avec le vainqueur!
Voir le screenshot qui montre à quoi ça ressemble.
Je me laisse la semaine prochaine pour analyser ces données pour une analyse vendredi prochain alors stay-tuned !
PS : Si ces données vous intéressent dites le moi en commentaires et je vous envoie un export csv.
