इस लेख में, मैं आपको पायथन का उपयोग करके मौसम के पैटर्न का विश्लेषण करने के बारे में बताऊंगा। तापमान के रुझान की पहचान करने से लेकर वर्षा की कल्पना करने तक, यह चरण-दर-चरण मार्गदर्शिका मौसम विश्लेषण के लिए डेटा विज्ञान तकनीकों का उपयोग करने में रुचि रखने वाले किसी भी व्यक्ति के लिए एकदम सही है। मैं व्यावहारिक अंतर्दृष्टि के लिए कोड, डेटा हेरफेर और विज़ुअलाइज़ेशन का पता लगाऊंगा।
केन्या में, मौसम कई क्षेत्रों, विशेष रूप से कृषि, पर्यटन और बाहरी गतिविधियों में महत्वपूर्ण भूमिका निभाता है। किसानों, व्यवसायों और कार्यक्रम योजनाकारों को निर्णय लेने के लिए मौसम की सटीक जानकारी की आवश्यकता होती है। हालाँकि, विभिन्न क्षेत्रों में मौसम का पैटर्न काफी भिन्न हो सकता है, और वर्तमान पूर्वानुमान प्रणालियाँ हमेशा स्थानीयकृत अंतर्दृष्टि प्रदान नहीं कर सकती हैं।
इस परियोजना का उद्देश्य केन्या के विभिन्न क्षेत्रों के लिए ओपनवेदरमैप एपीआई और वेदर एपीआई से वास्तविक समय का मौसम डेटा एकत्र करना है। इस डेटा को एक डेटाबेस में संग्रहीत किया जाएगा और अंतर्दृष्टि को उजागर करने के लिए पायथन का उपयोग करके विश्लेषण किया जाएगा:-
इस परियोजना में, मैं केन्या के विभिन्न शहरों के लिए मौसम की जानकारी वाले डेटासेट का विश्लेषण करता हूं। डेटासेट में तापमान, आर्द्रता, दबाव, हवा की गति, दृश्यता और वर्षा सहित अन्य कारकों सहित मौसम अवलोकन की 3,000 से अधिक पंक्तियाँ शामिल हैं। इन जानकारियों का उपयोग करते हुए, हमारा लक्ष्य सटीक, क्षेत्र विशिष्ट मौसम पूर्वानुमान प्रदान करना है जो कृषि, पर्यटन और यहां तक कि प्रबंधन जैसे मौसम संवेदनशील क्षेत्रों में निर्णय लेने में सहायता कर सकता है।
डेटासेट को कई कॉलमों का उपयोग करके संरचित किया गया था:
डेटाबेस में डेटा को इस प्रकार संरचित किया जाता है।
विश्लेषण के पहले चरण में डेटा की बुनियादी खोज शामिल थी।
_ डेटा आयाम - डेटासेट में 3,000 पंक्तियाँ और 14 कॉलम हैं।
_ शून्य मान - न्यूनतम गुम डेटा, यह सुनिश्चित करना कि डेटासेट आगे के विश्लेषण के लिए विश्वसनीय था।
print(df1[['temperature_celsius', 'humidity_pct', 'pressure_hpa', 'wind_speed_ms', 'rain', 'clouds']].describe())
उपरोक्त कोड का उपयोग करते हुए, हमने संख्यात्मक स्तंभों के लिए सारांश आंकड़ों की गणना की, जो तापमान, आर्द्रता, दबाव, वर्षा और बादलों की सीमा, माध्य और प्रसार में अंतर्दृष्टि प्रदान करते हैं।
मौसम की विशेषताओं की स्पष्ट समझ हासिल करने के लिए, हमने विभिन्न वितरण तैयार किए:
तापमान वितरण
sns.displot(df1['temperature_celsius'], bins=50, kde=True) plt.title('Temperature Distribution') plt.xlabel('Temperature (Celsius)')
इस वितरण से शहरों में तापमान के सामान्य प्रसार का पता चलता है। केडीई लाइन प्लॉट तापमान की संभाव्यता वितरण का एक सहज अनुमान देता है।
वर्षा वितरण
sns.displot(df1['rain'], bins=50, kde=True) plt.title('Rainfall Distribution') plt.xlabel('Rainfall (mm/h)')
यह कोड केन्याई शहरों में वर्षा वितरण का विश्लेषण करता है।
आर्द्रता, दबाव और हवा की गति
आर्द्रता (%), दबाव (hPa), और हवा की गति (एम/एस) के लिए समान वितरण प्लॉट, प्रत्येक उपयोगी अंतर्दृष्टि प्रदान करता है डेटासेट में इन मापदंडों की विविधताएं।
मौसम की स्थिति (उदाहरण के लिए, 'बादल', 'बारिश') को उनके आनुपातिक वितरण को दिखाने के लिए पाई चार्ट का उपयोग करके गिना और देखा गया:
condition_counts = df1['weather_condition'].value_counts() plt.figure(figsize=(8,8)) plt.pie(condition_counts, labels=condition_counts.index, autopct='%1.1f%%', pctdistance=1.1, labeldistance=0.6, startangle=140) plt.title('Distribution of Weather Conditions') plt.axis('equal') plt.show()
मुख्य विश्लेषणों में से एक शहर की कुल वर्षा थी:
rainfall_by_city = df1.groupby('city')['rain'].sum().sort_values() plt.figure(figsize=(12,12)) rainfall_by_city.plot(kind='barh', color='skyblue') plt.title('Total Rainfall by City') plt.xlabel('Total Rainfall (mm)') plt.ylabel('City') plt.tight_layout() plt.show()
इस बार प्लॉट में इस बात पर प्रकाश डाला गया है कि किन शहरों में देखी गई अवधि के दौरान सबसे अधिक बारिश हुई, कुछ आउटलेर दूसरों की तुलना में महत्वपूर्ण वर्षा दिखाते हैं।
avg_temp_by_month.plot(kind='line') plt.title('Average Monthly Temperature')
लाइन चार्ट से विभिन्न महीनों में तापमान में उतार-चढ़ाव का पता चलता है, जो मौसमी बदलाव दिखाता है।
monthly_rain.plot(kind='line') plt.title('Average Monthly Rainfall')
इसी तरह, वर्षा का विश्लेषण यह देखने के लिए किया गया कि यह महीने-दर-महीने कैसे बदलती है।
हमने मासिक तापमान और वर्षा की अधिक सहज समझ के लिए हीटमैप का उपयोग करके डेटा की कल्पना भी की।
यहां औसत मासिक तापमान और वर्षा के लिए हीटमैप दिए गए हैं
इसके बाद, मैंने प्रमुख मौसम चरों के बीच सहसंबंध मैट्रिक्स की गणना की:
correlation_matrix = df1[['temperature_celsius', 'humidity_pct', 'pressure_hpa', 'wind_speed_ms', 'rain', 'clouds']].corr() correlation_matrix sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm') plt.title('Correlation Between Weather Variables')
इस हीटमैप ने हमें चरों के बीच संबंधों की पहचान करने की अनुमति दी। उदाहरण के लिए, जैसा कि अपेक्षित था, हमने तापमान और आर्द्रता के बीच एक नकारात्मक सहसंबंध देखा।
मैंने मोम्बासा और न्येरी जैसे अलग-अलग शहरों पर ध्यान केंद्रित किया है, ताकि उनके अद्वितीय मौसम पैटर्न का पता लगाया जा सके:
मोम्बासा तापमान रुझान
plt.plot(monthly_avg_temp_msa) plt.title('Temperature Trends in Mombasa Over Time')
इस शहर में साल भर तापमान में महत्वपूर्ण बदलाव देखा गया।
न्येरी वर्षा रुझान
plt.plot(monthly_avg_rain_nyr) plt.title('Rainfall Trends in Nyeri Over Time')
न्येरी के लिए वर्षा डेटा ने एक स्पष्ट मौसमी पैटर्न प्रदर्शित किया, जिसमें कुछ महीनों के दौरान वर्षा चरम पर थी।
यह विश्लेषण प्रमुख शहरों में मौसम की स्थिति का एक व्यापक अवलोकन प्रदान करता है, जिसमें तापमान, वर्षा और अन्य प्रमुख मौसम चर पर प्रकाश डाला जाता है। हिस्टोग्राम, लाइन चार्ट, पाई चार्ट और हीटमैप जैसे विज़ुअलाइज़ेशन का उपयोग करके, हम डेटा में सार्थक अंतर्दृष्टि निकालने में सक्षम थे। आगे के विश्लेषण में इन रुझानों की ऐतिहासिक मौसम पैटर्न के साथ तुलना करना या भविष्य के मौसम के रुझान का पूर्वानुमान लगाने के लिए पूर्वानुमानित मॉडलिंग की खोज करना शामिल हो सकता है।
आप इस विश्लेषण के लिए पूरे कोड के साथ ज्यूपिटर नोटबुक मेरे GitHub रिपॉजिटरी में पा सकते हैं)।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3