使用 Pandas 和 Matplotlib 按列值對散點圖著色
Matplotlib 是一個流行的 Python 庫,用於在Python。本文探討使用 Matplotlib 根據 Pandas DataFrame 特定列中的值對散佈圖進行著色。
導入和資料
首先,我們導入必要的函式庫,包括 Matplotlib(作為 plt)和 Pandas(作為 pd)。我們也產生一個包含三列的範例資料幀(「df」):「身高」、「體重」和「性別」。
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
np.random.seed(0)
N = 37
_genders = ["Female", "Male", "Non-binary", "No Response"]
df = pd.DataFrame({
"Height (cm)": np.random.uniform(low=130, high=200, size=N),
"Weight (kg)": np.random.uniform(low=30, high=100, size=N),
"Gender": np.random.choice(_genders, size=N),
})
2021年8月更新
Seaborn引入了新的圖形級函數,例如0.11.0版本中的seaborn.relplot。建議使用這些函數,而不是直接使用 FacetGrid。
sns.relplot(data=df, x="Weight (kg)", y="Height (cm)", hue="Gender", hue_order=_genders, aspect=1.61)
plt.show()
舊答案 (2015)
如果你想直接使用 Matplotlib,你需要將 matplotlib 的散佈函數對應到 Pandas DataFrame 的類別上。為此:
def dfScatter(df, xcol='Height', ycol='Weight', catcol='Gender'):
fig, ax = plt.subplots()
categories = np.unique(df[catcol])
colors = np.linspace(0, 1, len(categories))
colordict = dict(zip(categories, colors))
df["Color"] = df[catcol].apply(lambda x: colordict[x])
ax.scatter(df[xcol], df[ycol], c=df.Color)
return fig
fig = dfScatter(df)
fig.savefig('fig1.png')
按照以下步驟,您可以使用 Pandas 和 Matplotlib 輕鬆地根據列值對散佈圖進行顏色繪製。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3