Pandas 및 Matplotlib를 사용하여 열 값별로 산점도 색상 지정
Matplotlib는 정적, 애니메이션 및 대화형 시각화를 생성하는 데 널리 사용되는 Python 라이브러리입니다. 파이썬. 이 문서에서는 Matplotlib를 사용하여 Pandas DataFrame의 특정 열에 있는 값을 기반으로 산점도에 색상을 지정하는 방법을 살펴봅니다.
가져오기 및 데이터
시작하려면 필요한 라이브러리를 가져옵니다. , Matplotlib(plt) 및 Pandas(pd)를 포함합니다. 또한 "Height", "Weight" 및 "Gender"라는 세 개의 열이 있는 샘플 DataFrame("df")을 생성합니다.
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
np.random.seed(0)
N = 37
_genders = ["Female", "Male", "Non-binary", "No Response"]
df = pd.DataFrame({
"Height (cm)": np.random.uniform(low=130, high=200, size=N),
"Weight (kg)": np.random.uniform(low=30, high=100, size=N),
"Gender": np.random.choice(_genders, size=N),
})
2021년 8월 업데이트
Seaborn은 버전 0.11.0에서 seaborn.replot과 같은 새로운 피규어 수준 기능을 도입했습니다. 이러한 기능은 FacetGrid를 직접 사용하는 것보다 권장됩니다.
sns.relplot(data=df, x="Weight (kg)", y="Height (cm)", hue="Gender", hue_order=_genders, aspect=1.61)
plt.show()
이전 답변(2015)
Matplotlib를 직접 사용하려면 matplotlib의 분산 기능을 Pandas DataFrame의 카테고리에 매핑해야 합니다. . 이렇게 하려면 다음을 수행하세요.
def dfScatter(df, xcol='Height', ycol='Weight', catcol='Gender'):
fig, ax = plt.subplots()
categories = np.unique(df[catcol])
colors = np.linspace(0, 1, len(categories))
colordict = dict(zip(categories, colors))
df["Color"] = df[catcol].apply(lambda x: colordict[x])
ax.scatter(df[xcol], df[ycol], c=df.Color)
return fig
fig = dfScatter(df)
fig.savefig('fig1.png')
이 단계를 따르면 Pandas 및 Matplotlib를 사용하여 열 값을 기반으로 산점도를 쉽게 색상화할 수 있습니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3