Ich habe vor kurzem meine Reise in die Fußballanalyse begonnen und ein Beispiel-Python-Programm erstellt, das auf https://understat.com/ verweist, um einzelne Spielschussdaten zu extrahieren.
Dies markiert den Beginn meiner Reise in die Datenmanipulation. Ich freue mich darauf, tiefer in dieses Gebiet einzutauchen und freue mich darauf, im Laufe meiner Fortschritte weitere Updates zu teilen.
Repo:
https://github.com/UribeJr/football-data-scraper-to-csv-exporter
#!/usr/bin/env python # coding: utf-8 # In[2]: #import modules and packages import requests from bs4 import BeautifulSoup import json import pandas as pd # In[3]: #scrape single game shots base_url = 'https://understat.com/match/' match = str(input("Enter your match ID: ")) url = base_url match # In[16]: res = requests.get(url) soup = BeautifulSoup(res.content, 'lxml') span = soup.find('span') script = soup.find_all('script') script # In[18]: string = script[1].string string # In[26]: #strip symbols so we only have json data index_start = string.index("('") 2 index_end = string.index("')") json_data = string[index_start:index_end] json_data = json_data.encode('utf8').decode('unicode_escape') data = json.loads(json_data) # In[35]: df_h = pd.DataFrame(data['h']) print("Home Team DataFrame:") print(df_h.head()) # In[37]: # Save the home team DataFrame to a CSV file df_h.to_csv('home_team_shots.csv', index=False) # In[ ]:
Das Programm extrahiert dann die Schussdaten aus dem Spiel und wandelt die Daten jedes Heim- und Auswärtsteams in einen separaten Datenrahmen um. Die Datenrahmen werden dann als separate CSV-Dateien als Referenz exportiert.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3