열 값에 따라 산점도 색상 지정
Python에서 Matplotlib 라이브러리는 산점도 미학을 사용자 정의하는 여러 가지 방법을 제공합니다. 일반적인 작업 중 하나는 특정 열의 값을 기반으로 색상을 할당하는 것입니다.
Seaborn 통합
한 가지 솔루션은 Matplotlib를 기반으로 구축된 Seaborn 라이브러리를 활용하는 것입니다. Seaborn은 산점도를 특정 열에 쉽게 매핑할 수 있는 sns.relplot 및 sns.FacetGrid와 같은 고급 기능을 제공합니다. 색상 매개변수를 지정하면 카테고리 라벨이 포함된 세 번째 열에 따라 포인트 색상을 지정할 수 있습니다.
import seaborn as sns
sns.relplot(data=df, x='Weight (kg)', y='Height (cm)', hue='Gender')
Matplotlib를 직접 사용
또는 Matplotlib의 plt.scatter 함수를 직접 사용하여 분산형 차트를 만들고 색상을 수동으로 지정할 수 있습니다. 이를 위해서는 카테고리 레이블을 색상에 매핑하는 사용자 정의 색상 사전을 만들어야 합니다.
def dfScatter(df, xcol='Height', ycol='Weight', catcol='Gender'):
fig, ax = plt.subplots()
categories = np.unique(df[catcol])
colors = np.linspace(0, 1, len(categories))
colordict = dict(zip(categories, colors))
df['Color'] = df[catcol].apply(lambda x: colordict[x])
ax.scatter(df[xcol], df[ycol], c=df.Color)
return fig
이 함수를 호출하면 지정된 범주 열로 색상이 지정된 산점도를 생성할 수 있습니다.
df = pd.DataFrame({'Height': np.random.normal(size=10),
'Weight': np.random.normal(size=10),
'Gender': ["Male", "Male", "Unknown", "Male", "Male",
"Female", "Did not respond", "Unknown", "Female", "Female"]})
fig = dfScatter(df)
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3