J'ai récemment commencé mon voyage en plongeant dans l'analyse du football et j'ai créé un exemple de programme Python qui fait référence à https://understat.com/ pour récupérer les données de tir d'un seul match.
Cela marque le début de mon voyage dans la manipulation de données. Je suis ravi de plonger plus profondément dans ce domaine et j'ai hâte de partager plus de mises à jour au fur et à mesure de mes progrès.
Dépôt :
https://github.com/UribeJr/football-data-scraper-to-csv-exporter
#!/usr/bin/env python # coding: utf-8 # In[2]: #import modules and packages import requests from bs4 import BeautifulSoup import json import pandas as pd # In[3]: #scrape single game shots base_url = 'https://understat.com/match/' match = str(input("Enter your match ID: ")) url = base_url match # In[16]: res = requests.get(url) soup = BeautifulSoup(res.content, 'lxml') span = soup.find('span') script = soup.find_all('script') script # In[18]: string = script[1].string string # In[26]: #strip symbols so we only have json data index_start = string.index("('") 2 index_end = string.index("')") json_data = string[index_start:index_end] json_data = json_data.encode('utf8').decode('unicode_escape') data = json.loads(json_data) # In[35]: df_h = pd.DataFrame(data['h']) print("Home Team DataFrame:") print(df_h.head()) # In[37]: # Save the home team DataFrame to a CSV file df_h.to_csv('home_team_shots.csv', index=False) # In[ ]:
Le programme récupère ensuite les données de tir du match et convertit les données de chaque équipe à domicile et à l'extérieur dans une trame de données distincte. Les trames de données sont ensuite exportées sous forme de fichiers CSV distincts pour référence.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3