Раскрашивание диаграмм рассеяния по значениям столбцов в Python
Универсальность ggplot2 в R позволяет плавно назначать цвета точкам данных на основе столбца ценности. Эту функцию также можно воспроизвести в Python с использованием фреймов данных pandas и Matplotlib.
Использование Pandas и Matplotlib
Чтобы сопоставить цвета со значениями в Matplotlib, рассмотрите следующие шаги:
Вот пример реализации:
def dfScatter(df, xcol='Height', ycol='Weight', catcol='Gender'):
fig, ax = plt.subplots()
categories = np.unique(df[catcol])
colors = np.linspace(0, 1, len(categories))
colordict = dict(zip(categories, colors))
df["Color"] = df[catcol].apply(lambda x: colordict[x])
ax.scatter(df[xcol], df[ycol], c=df.Color)
return fig
Пример использования
Рассмотрим фрейм данных со столбцами «Высота», «Вес» и «Пол». Чтобы создать точечную диаграмму, на которой цвета назначаются на основе столбца «Пол»:
df = pd.DataFrame({'Height':np.random.normal(size=10),
'Weight':np.random.normal(size=10),
'Gender': ["Male","Male","Unknown","Male","Male",
"Female","Did not respond","Unknown","Female","Female"]})
fig = dfScatter(df)
Это создаст диаграмму рассеяния, где столбец «Пол» определяет цвет каждой точки данных.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3