이 글에서는 Python을 사용하여 날씨 패턴을 분석하는 방법을 안내하겠습니다. 온도 추세 식별부터 강수량 시각화까지, 이 단계별 가이드는 날씨 분석을 위한 데이터 과학 기술 사용에 관심이 있는 모든 사람에게 적합합니다. 실용적인 통찰력을 얻기 위해 코드, 데이터 조작 및 시각화를 탐구하겠습니다.
케냐에서 날씨는 다양한 분야, 특히 농업, 관광, 야외 활동에서 중요한 역할을 합니다. 농부, 기업, 이벤트 기획자는 결정을 내리기 위해 정확한 날씨 정보가 필요합니다. 그러나 날씨 패턴은 지역마다 크게 다를 수 있으며 현재 예측 시스템이 항상 현지화된 통찰력을 제공하는 것은 아닙니다.
이 프로젝트의 목적은 OpenWeatherMap API 및 Weather API에서 케냐 전역의 다양한 지역에 대한 실시간 날씨 데이터를 수집하는 것입니다. 이 데이터는 데이터베이스에 저장되고 Python을 사용하여 분석되어 다음에 대한 통찰력을 얻습니다.-
이 프로젝트에서는 케냐 여러 도시의 날씨 정보가 포함된 데이터 세트를 분석합니다. 데이터 세트에는 온도, 습도, 기압, 풍속, 가시성, 강우량 등 다양한 요인을 포함하여 3,000개 이상의 기상 관측 데이터가 포함되어 있습니다. 이러한 통찰력을 사용하여 우리는 농업, 관광, 심지어 경영과 같이 날씨에 민감한 분야의 의사 결정에 도움이 될 수 있는 정확한 지역별 일기 예보를 제공하는 것을 목표로 합니다.
데이터세트는 여러 열을 사용하여 구성되었습니다.
데이터베이스에서 데이터가 구성되는 방식입니다.
분석의 첫 번째 단계에는 데이터의 기본 탐색이 포함되었습니다.
_ 데이터 차원 - 데이터세트에는 3,000개의 행과 14개의 열이 포함되어 있습니다.
_ Null 값 - 누락된 데이터가 최소화되어 추가 분석을 위해 데이터 세트를 신뢰할 수 있습니다.
print(df1[['temperature_celsius', 'humidity_pct', 'pressure_hpa', 'wind_speed_ms', 'rain', 'clouds']].describe())
위 코드를 사용하여 숫자 열에 대한 요약 통계를 계산하여 온도, 습도, 기압, 강수량 및 구름의 범위, 평균 및 확산에 대한 통찰력을 제공했습니다.
날씨 특징을 더욱 명확하게 이해하기 위해 다양한 분포를 그렸습니다.
온도 분포
sns.displot(df1['temperature_celsius'], bins=50, kde=True) plt.title('Temperature Distribution') plt.xlabel('Temperature (Celsius)')
이 분포는 도시 전체의 일반적인 온도 분포를 나타냅니다. KDE 선 도표는 온도 확률 분포를 원활하게 추정합니다.
강수량 분포
sns.displot(df1['rain'], bins=50, kde=True) plt.title('Rainfall Distribution') plt.xlabel('Rainfall (mm/h)')
이 코드는 케냐 도시 전체의 강수량 분포를 분석합니다.
습도, 압력 및 풍속
습도(%), 기압(hPa) 및 풍속(m/s)에 대한 유사한 분포도는 각각에 대한 유용한 통찰력을 제공합니다. 데이터세트 전체에서 이러한 매개변수의 변형이 발생합니다.
날씨 조건(예: '구름', '비')을 계산하고 원형 차트를 사용하여 시각화하여 비례 분포를 표시했습니다.
condition_counts = df1['weather_condition'].value_counts() plt.figure(figsize=(8,8)) plt.pie(condition_counts, labels=condition_counts.index, autopct='%1.1f%%', pctdistance=1.1, labeldistance=0.6, startangle=140) plt.title('Distribution of Weather Conditions') plt.axis('equal') plt.show()
주요 분석 중 하나는 도시별 총 강수량이었습니다.
rainfall_by_city = df1.groupby('city')['rain'].sum().sort_values() plt.figure(figsize=(12,12)) rainfall_by_city.plot(kind='barh', color='skyblue') plt.title('Total Rainfall by City') plt.xlabel('Total Rainfall (mm)') plt.ylabel('City') plt.tight_layout() plt.show()
이 막대 그래프는 관찰 기간 동안 가장 많은 비가 내린 도시를 강조했으며, 몇몇 이상치는 다른 도시에 비해 상당한 강수량을 보여주었습니다.
avg_temp_by_month.plot(kind='line') plt.title('Average Monthly Temperature')
선형 차트는 여러 달에 걸쳐 온도 변동을 보여 계절적 변화를 보여줍니다.
monthly_rain.plot(kind='line') plt.title('Average Monthly Rainfall')
마찬가지로 강우량도 분석하여 월별 변화를 관찰했습니다.
또한 월별 기온과 강수량을 보다 직관적으로 이해할 수 있도록 히트맵을 사용하여 데이터를 시각화했습니다.
월 평균 기온과 강우량에 대한 히트맵은 다음과 같습니다.
다음으로 주요 기상 변수 간의 상관 행렬을 계산했습니다.
correlation_matrix = df1[['temperature_celsius', 'humidity_pct', 'pressure_hpa', 'wind_speed_ms', 'rain', 'clouds']].corr() correlation_matrix sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm') plt.title('Correlation Between Weather Variables')
이 히트맵을 통해 변수 간의 관계를 식별할 수 있었습니다. 예를 들어 우리는 예상대로 온도와 습도 사이에 음의 상관관계가 있음을 관찰했습니다.
몸바사와 니에리 같은 개별 도시에 초점을 맞춰 독특한 날씨 패턴을 살펴봤습니다.
몸바사 온도 추세
plt.plot(monthly_avg_temp_msa) plt.title('Temperature Trends in Mombasa Over Time')
이 도시는 일년 내내 기온의 상당한 변화를 보였습니다.
니에리 강수량 추세
plt.plot(monthly_avg_rain_nyr) plt.title('Rainfall Trends in Nyeri Over Time')
니에리의 강수량 데이터는 뚜렷한 계절 패턴을 보여 주었으며, 특정 달에 강우량이 최고조에 달했습니다.
이 분석은 온도, 강우량 및 기타 주요 기상 변수를 강조하여 주요 도시의 기상 조건에 대한 포괄적인 개요를 제공합니다. 히스토그램, 선 차트, 원형 차트, 히트맵과 같은 시각화를 사용하여 데이터에 대한 의미 있는 통찰력을 추출할 수 있었습니다. 추가 분석에는 이러한 추세를 과거 날씨 패턴과 비교하거나 예측 모델링을 탐색하여 미래 날씨 추세를 예측하는 작업이 포함될 수 있습니다.
내 GitHub 저장소에서 이 분석에 대한 전체 코드가 포함된 Jupyter Notebook을 찾을 수 있습니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3