"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > एनबीए गेम डेटा का विश्लेषण करने के लिए पायथन का उपयोग करना

एनबीए गेम डेटा का विश्लेषण करने के लिए पायथन का उपयोग करना

2024-11-02 को प्रकाशित
ब्राउज़ करें:891

Using Python to Analyze NBA Game Data

नेशनल बास्केटबॉल एसोसिएशन (एनबीए) दुनिया की सबसे रोमांचक खेल लीगों में से एक है, जिसमें हर सीजन में लाखों प्रशंसक खेल देखने आते हैं। उन व्यक्तियों के लिए जो बास्केटबॉल और डेटा विश्लेषण दोनों को पसंद करते हैं, एनबीए गेम सांख्यिकी अंतर्दृष्टि का खजाना प्रदान करती है। खिलाड़ी के समग्र प्रदर्शन से लेकर टीम के तथ्यों तक, एनबीए खेल डेटा को पढ़ने और समझने के लिए पायथन एक उच्च गुणवत्ता वाला उपकरण है। इस मैनुअल में, हम यह पता लगाएंगे कि एनबीए आंकड़ों में गोता लगाने और आपको अपना स्वयं का मूल्यांकन कार्य शुरू करने में सहायता करने के लिए पायथन का उपयोग कैसे किया जा सकता है।

1. एनबीए डेटा विश्लेषण का परिचय

एनबीए विभिन्न प्रकार के तथ्यों पर नज़र रखता है, जिसमें प्रतिभागी रिकॉर्ड (कारक, सहायता, रिबाउंड), समूह विशिष्ट प्रदर्शन (जीत, हार, टर्नओवर), और प्रयास प्रभाव शामिल हैं। इन आँकड़ों को पढ़कर, आप खिलाड़ी की दक्षता, चालक दल की रणनीतियों, या यहाँ तक कि खेल परिणामों की आशा के बारे में जानकारी प्राप्त कर सकते हैं। पायथन एक शक्तिशाली प्रोग्रामिंग भाषा है, इसका उपयोग सूचना मूल्यांकन के लिए बड़े पैमाने पर किया जाता है, और यह एनबीए तथ्यों के साथ चलने के लिए आदर्श है।

आरंभ करने के लिए आपको क्या चाहिए

कोडिंग शुरू करने से पहले, आपको कुछ चीज़ों की आवश्यकता होगी:

पायथन: सुनिश्चित करें कि आपके कंप्यूटर पर पायथन स्थापित है।
पुस्तकालय: हम पांडा, मैटप्लोटलिब और सीबॉर्न जैसे कुछ पायथन पुस्तकालयों का उपयोग करेंगे।
एनबीए डेटा स्रोत: आप एनबीए डेटा को एनबीए की आधिकारिक सांख्यिकी वेबसाइट या बास्केटबॉल रेफरेंस या कागल जैसे तीसरे पक्ष के प्लेटफॉर्म जैसे स्रोतों से पा सकते हैं।

2. अपना पायथन वातावरण स्थापित करना

एनबीए गेम तथ्यों को पढ़ना शुरू करने के लिए, आपको सबसे पहले अपना पायथन परिवेश स्थापित करना होगा। आप अपना पायथन कोड लिखने और चलाने के लिए ज्यूपिटर नोटबुक या Google Colab जैसे टूल का उपयोग कर सकते हैं।

आवश्यक पुस्तकालय स्थापित करें

आवश्यक पायथन लाइब्रेरी स्थापित करने के लिए निम्नलिखित कमांड चलाएँ:

पिप इंस्टाल पांडा
पिप इंस्टाल matplotlib
पिप इंस्टाल सीबॉर्न

  • पांडा बड़े डेटासेट को प्रबंधित और हेरफेर करने में मदद करता है।
  • Matplotlib और Seaborn डेटा को विज़ुअलाइज़ करने के लिए हैं।

3. एनबीए डेटा आयात और लोड करना

मान लें कि आपने CSV प्रारूप में NBA डेटासेट डाउनलोड किया है। पहला कदम पांडा का उपयोग करके डेटासेट को पायथन में लोड करना है। यहां बताया गया है कि आप यह कैसे कर सकते हैं:

पांडा को पीडी के रूप में आयात करें

एनबीए डेटा को डेटाफ़्रेम में लोड करें

nba_data = pd.read_csv('nba_game_data.csv')

डेटासेट की पहली कुछ पंक्तियाँ देखें

प्रिंट(nba_data.head())

हेड() फ़ंक्शन डेटा की पहली पांच पंक्तियां दिखाएगा, जिससे आपको यह पता चल जाएगा कि डेटासेट में कौन से कॉलम और जानकारी शामिल है। सामान्य कॉलम में खिलाड़ी के नाम, प्राप्त अंक, सहायता, रिबाउंड और खेल की तारीखें शामिल हो सकती हैं।

4. डेटा की सफाई और तैयारी

अक्सर, वास्तविक दुनिया के डेटासेट में गुम या गलत डेटा होता है, जिसे विश्लेषण से पहले साफ करने की आवश्यकता होती है। आइए देखें कि क्या हमारे डेटासेट में कोई गुम मान हैं:

# गुम मानों की जांच करें
प्रिंट(nba_data.isnull().sum())
यदि आपको कोई लुप्त मान मिलता है, तो आप या तो उन्हें औसत मान से भर सकते हैं या उन पंक्तियों को हटा सकते हैं:

# लुप्त मानों को माध्य कॉलम से भरें
nba_data.fillna(nba_data.mean(), inplace=True)
अब जब डेटा साफ हो गया है, तो आप विश्लेषण शुरू करने के लिए तैयार हैं!

5. बुनियादी एनबीए डेटा विश्लेषण

आइए एक सरल विश्लेषण से शुरुआत करें: सभी खिलाड़ियों द्वारा प्रति गेम बनाए गए औसत अंक ज्ञात करना।

# प्रति गेम औसत अंक की गणना करें
औसत_अंक = nba_data['अंक'].mean()
प्रिंट(f'प्रति गेम औसत अंक: {औसत_अंक}')`
इससे हमें त्वरित जानकारी मिलती है कि खिलाड़ी डेटासेट में औसतन कितने अंक प्राप्त कर रहे हैं।

खिलाड़ी के प्रदर्शन का विश्लेषण

अब, मान लीजिए कि आप विश्लेषण करना चाहते हैं कि लेब्रोन जेम्स जैसे किसी विशेष खिलाड़ी ने पूरे सीज़न में कैसा प्रदर्शन किया। आप उसके गेम पर ध्यान केंद्रित करने के लिए डेटासेट को फ़िल्टर कर सकते हैं:

लेब्रोन जेम्स के लिए # फ़िल्टर डेटा
लेब्रोन_डेटा = एनबीए_डेटा[एनबीए_डेटा['प्लेयर'] == 'लेब्रोन जेम्स']

लेब्रोन के लिए प्रति गेम औसत अंक की गणना करें

lebron_avg_points =lebron_data['points'].mean()
प्रिंट(f'LeBron James औसत अंक प्रति गेम: {lebron_avg_points}')

6. एनबीए डेटा विज़ुअलाइज़ करना

विज़ुअलाइज़ेशन से आपके निष्कर्षों को समझना और प्रस्तुत करना आसान हो जाता है। आइए लेब्रोन जेम्स द्वारा प्रति गेम बनाए गए अंकों की संख्या की कल्पना करने के लिए एक सरल प्लॉट बनाएं:

matplotlib.pyplot को plt के रूप में आयात करें

प्रति गेम लेब्रोन के अंक प्लॉट करें
plt.plot(lebron_data['game_date'], लेब्रोन_डेटा['अंक'], मार्कर='o')
plt.title('लेब्रोन जेम्स पॉइंट्स प्रति गेम')
plt.xlabel('गेम दिनांक')
plt.ylabel('स्कोर किए गए अंक')
plt.xticks(रोटेशन=45)
plt.शो()
यह सीज़न में लेब्रोन के स्कोरिंग प्रदर्शन को दर्शाने वाला एक लाइन ग्राफ तैयार करेगा, जिसमें प्रत्येक बिंदु एक विशिष्ट गेम में उसके स्कोर का प्रतिनिधित्व करेगा।

7. टीम के प्रदर्शन का विश्लेषण

हम टीम के प्रदर्शन का विश्लेषण करने के लिए पायथन का भी उपयोग कर सकते हैं। आइए सभी खेलों में लॉस एंजिल्स लेकर्स द्वारा बनाए गए औसत अंकों की गणना करें:

लॉस एंजिल्स लेकर्स के लिए # फ़िल्टर डेटा
लेकर्स_डेटा = एनबीए_डेटा[एनबीए_डेटा['टीम'] == 'लॉस एंजिल्स लेकर्स']

लेकर्स के लिए प्रति गेम औसत अंक की गणना करें

lakers_avg_points =lakers_data['points'].mean()
प्रिंट(f'लॉस एंजिल्स लेकर्स औसत अंक प्रति गेम: {lakers_avg_points}')
इससे हमें पता चलता है कि लेकर्स एक टीम के रूप में कैसा प्रदर्शन करते हैं, जिसकी तुलना अन्य टीमों या पिछले सीज़न से की जा सकती है।

8. उन्नत विश्लेषण: आँकड़ों के बीच सहसंबंध

कभी-कभी आप यह देखना चाहेंगे कि क्या दो आँकड़ों के बीच कोई संबंध है। उदाहरण के लिए, क्या अधिक अंक प्राप्त करने वाले खिलाड़ियों के पास अधिक सहायता भी होती है?

# अंक और सहायता के बीच सहसंबंध की गणना करें
सहसंबंध = nba_data['अंक'].corr(nba_data['सहायता'])
प्रिंट(f'अंक और सहायता के बीच सहसंबंध: {सहसंबंध}')
एक सकारात्मक सहसंबंध यह सुझाव देगा कि जो खिलाड़ी अधिक अंक प्राप्त करते हैं वे अधिक सहायता भी करते हैं।

9. मशीन लर्निंग के साथ गेम के परिणामों की भविष्यवाणी करना

एक बार जब आप डेटा का विश्लेषण कर लेते हैं, तो आप गेम के परिणामों की भविष्यवाणी करने के लिए मशीन लर्निंग मॉडल बनाकर इसे एक कदम आगे ले जा सकते हैं। हालाँकि इसके लिए अधिक उन्नत तकनीकों की आवश्यकता होती है, ऐतिहासिक डेटा के आधार पर एक मॉडल को प्रशिक्षित करने के लिए स्किकिट-लर्न जैसी पायथन लाइब्रेरी का उपयोग किया जा सकता है।

किसी मॉडल के प्रशिक्षण और परीक्षण के लिए डेटा को विभाजित करने का एक सरल उदाहरण यहां दिया गया है:

sklearn.model_selection से आयात ट्रेन_टेस्ट_स्प्लिट
sklearn.linear_model से LogisticRegression आयात करें

डेटा को प्रशिक्षण और परीक्षण सेट में विभाजित करें

X = nba_data[['अंक', 'सहायता', 'रिबाउंड']]
y = nba_data['win_los'] # win_los कॉलम मानते हुए (जीत के लिए 1, हार के लिए 0)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

एक लॉजिस्टिक रिग्रेशन मॉडल को प्रशिक्षित करें

मॉडल = लॉजिस्टिक रिग्रेशन()
मॉडल.फिट(X_train, y_train)

मॉडल का परीक्षण करें

सटीकता = मॉडल.स्कोर(X_test, y_test)
प्रिंट(f'मॉडल सटीकता: {सटीकता}')
अधिक सटीक भविष्यवाणियां करने के लिए इस बुनियादी मॉडल को अधिक डेटा और बेहतर सुविधा चयन के साथ परिष्कृत किया जा सकता है।

पायथन का उपयोग करके एनबीए गेम डेटा का विश्लेषण करने से बास्केटबॉल प्रशंसकों और डेटा उत्साही लोगों के लिए समान रूप से संभावनाओं की दुनिया खुल जाती है। खिलाड़ी के औसत की गणना करने से लेकर गेम के परिणामों की भविष्यवाणी करने तक, पायथन आपको गेम में छिपे हुए पैटर्न को उजागर करने की अनुमति देता है। केवल कुछ पुस्तकालयों और डेटासेट के साथ, आप अपना स्वयं का विश्लेषण प्रोजेक्ट शुरू कर सकते हैं और अपनी पसंदीदा टीमों और खिलाड़ियों के बारे में नई अंतर्दृष्टि खोज सकते हैं। जितना अधिक आप अन्वेषण करेंगे, उतना अधिक आपको एहसास होगा कि बास्केटबॉल के खेल को समझने में डेटा कितना शक्तिशाली हो सकता है।

अक्सर पूछे जाने वाले प्रश्न (एफएक्यू)

Q1: मुझे विश्लेषण के लिए एनबीए गेम डेटा कहां मिल सकता है? आप एनबीए गेम डेटा एनबीए स्टैट्स, बास्केटबॉल रेफरेंस जैसी वेबसाइटों या कागल जैसे डेटा-शेयरिंग प्लेटफॉर्म पर पा सकते हैं।

Q2: एनबीए डेटा विश्लेषण के लिए कौन सी पायथन लाइब्रेरी सर्वोत्तम हैं? पांडा, मैटप्लोटलिब और सीबॉर्न डेटा हेरफेर और विज़ुअलाइज़ेशन के लिए महान हैं। मशीन लर्निंग के लिए, आप स्किकिट-लर्न जैसी लाइब्रेरी का उपयोग कर सकते हैं।

प्र3: क्या मैं एनबीए गेम के परिणामों की भविष्यवाणी करने के लिए पायथन का उपयोग कर सकता हूं? हाँ! मशीन लर्निंग तकनीकों का उपयोग करके, आप ऐतिहासिक गेम डेटा के आधार पर पूर्वानुमानित मॉडल बना सकते हैं।

प्र4: मैं विश्लेषण के लिए एनबीए डेटा को कैसे साफ़ करूं? आप fillna() जैसे फ़ंक्शंस का उपयोग करके गुम डेटा को संभाल सकते हैं या ड्रॉपना() के साथ समस्याग्रस्त पंक्तियों को हटा सकते हैं। विश्लेषण से पहले अपना डेटा साफ़ करना आवश्यक है।

प्र5: मैं पायथन के साथ किस प्रकार के एनबीए आँकड़ों का विश्लेषण कर सकता हूँ? आप खिलाड़ी आँकड़े (अंक, सहायता, रिबाउंड), टीम आँकड़े (जीत, हार, टर्नओवर), या यहाँ तक कि खिलाड़ी दक्षता रेटिंग (पीईआर) जैसे उन्नत मेट्रिक्स का विश्लेषण कर सकते हैं।

प्र6: एनबीए डेटा विश्लेषण के लिए पायथन सीखना कितना कठिन है? पायथन को सीखने के लिए सबसे आसान प्रोग्रामिंग भाषाओं में से एक माना जाता है। कुछ बुनियादी ट्यूटोरियल के साथ, आप तुरंत एनबीए डेटा का विश्लेषण शुरू कर सकते हैं।

एनबीएस्टॉर्म

विज्ञप्ति वक्तव्य यह आलेख यहां पुन: प्रस्तुत किया गया है: https://dev.to/nbastorm/using-python-to-analyze-nba-game-data-13dl?1 यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए स्टडी_गोलंग@163.com से संपर्क करें।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3