Python에서 열 값별로 산점도 색상 지정
R에서 ggplot2의 다양성을 통해 열을 기반으로 데이터 포인트에 색상을 원활하게 할당할 수 있습니다. 가치. 이 기능은 pandas 데이터 프레임 및 Matplotlib를 사용하여 Python에서 복제할 수도 있습니다.
Pandas 및 Matplotlib 사용
색상을 Matplotlib의 값에 매핑하려면 다음 단계를 고려하세요.
구현 예는 다음과 같습니다.
def dfScatter(df, xcol='Height', ycol='Weight', catcol='Gender'):
fig, ax = plt.subplots()
categories = np.unique(df[catcol])
colors = np.linspace(0, 1, len(categories))
colordict = dict(zip(categories, colors))
df["Color"] = df[catcol].apply(lambda x: colordict[x])
ax.scatter(df[xcol], df[ycol], c=df.Color)
return fig
사용 예
키, 몸무게, 성별 열이 있는 데이터프레임을 생각해 보세요. 성별 열을 기준으로 색상이 할당되는 분산형 차트를 생성하려면:
df = pd.DataFrame({'Height':np.random.normal(size=10),
'Weight':np.random.normal(size=10),
'Gender': ["Male","Male","Unknown","Male","Male",
"Female","Did not respond","Unknown","Female","Female"]})
fig = dfScatter(df)
이것은 성별 열이 각 데이터 포인트의 색상을 결정하는 산점도를 생성합니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3