使用 Pandas 和 Matplotlib 按列值对散点图着色
Matplotlib 是一个流行的 Python 库,用于在Python。本文探讨使用 Matplotlib 根据 Pandas DataFrame 特定列中的值对散点图进行着色。
导入和数据
首先,我们导入必要的库,包括 Matplotlib(作为 plt)和 Pandas(作为 pd)。我们还生成一个包含三列的示例数据帧(“df”):“身高”、“体重”和“性别”。
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
np.random.seed(0)
N = 37
_genders = ["Female", "Male", "Non-binary", "No Response"]
df = pd.DataFrame({
"Height (cm)": np.random.uniform(low=130, high=200, size=N),
"Weight (kg)": np.random.uniform(low=30, high=100, size=N),
"Gender": np.random.choice(_genders, size=N),
})
2021年8月更新
Seaborn引入了新的图形级函数,例如0.11.0版本中的seaborn.relplot。推荐使用这些函数,而不是直接使用 FacetGrid。
sns.relplot(data=df, x="Weight (kg)", y="Height (cm)", hue="Gender", hue_order=_genders, aspect=1.61)
plt.show()
旧答案 (2015)
如果你想直接使用 Matplotlib,你需要将 matplotlib 的散布函数映射到 Pandas DataFrame 的类别上。为此:
def dfScatter(df, xcol='Height', ycol='Weight', catcol='Gender'):
fig, ax = plt.subplots()
categories = np.unique(df[catcol])
colors = np.linspace(0, 1, len(categories))
colordict = dict(zip(categories, colors))
df["Color"] = df[catcol].apply(lambda x: colordict[x])
ax.scatter(df[xcol], df[ycol], c=df.Color)
return fig
fig = dfScatter(df)
fig.savefig('fig1.png')
按照以下步骤,您可以使用 Pandas 和 Matplotlib 轻松地根据列值对散点图进行颜色绘制。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3