저는 최근 축구 분석에 대한 탐구를 시작했으며 단일 게임 샷 데이터를 스크랩하기 위해 https://understat.com/을 참조하는 샘플 Python 프로그램을 만들었습니다.
이것은 데이터 조작에 대한 나의 여정의 시작을 의미합니다. 이 분야에 대해 더 깊이 탐구하게 되어 기쁘게 생각하며 진행하면서 더 많은 업데이트를 공유할 수 있기를 기대합니다.
저장소:
https://github.com/UribeJr/football-data-scraper-to-csv-exporter
#!/usr/bin/env python # coding: utf-8 # In[2]: #import modules and packages import requests from bs4 import BeautifulSoup import json import pandas as pd # In[3]: #scrape single game shots base_url = 'https://understat.com/match/' match = str(input("Enter your match ID: ")) url = base_url match # In[16]: res = requests.get(url) soup = BeautifulSoup(res.content, 'lxml') span = soup.find('span') script = soup.find_all('script') script # In[18]: string = script[1].string string # In[26]: #strip symbols so we only have json data index_start = string.index("('") 2 index_end = string.index("')") json_data = string[index_start:index_end] json_data = json_data.encode('utf8').decode('unicode_escape') data = json.loads(json_data) # In[35]: df_h = pd.DataFrame(data['h']) print("Home Team DataFrame:") print(df_h.head()) # In[37]: # Save the home team DataFrame to a CSV file df_h.to_csv('home_team_shots.csv', index=False) # In[ ]:
그런 다음 프로그램은 경기에서 샷 데이터를 스크랩하고 각 홈 및 어웨이 팀 데이터를 별도의 데이터 프레임으로 변환합니다. 그런 다음 데이터 프레임은 참조용으로 별도의 CSV 파일로 내보내집니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3