В анализе данных часто полезно для данных в категории для упрощения его представления и анализа. Это общий метод при работе с числовыми данными, например, при работе с процентами. ['процент']. Head () 46.5 44.2 100.0 42.12
, чтобы врезаться в этот столбец и получить количество значений для каждой бина, мы можем использовать функцию Pd.cut. Вот два способа достичь этого:
df['percentage'].head() 46.5 44.2 100.0 42.12, используя Pd.cut с value_counts:
bins = [0, 1, 5, 10, 25, 50, 100, 100] df ['binned'] = pd.cut (df ['процент'], бункеры) print (df.groupby (df ['binnd']). size ())
с использованием np.searchsorted и groupby:df['percentage'].head() 46.5 44.2 100.0 42.12
df ['binnd'] = = = = = = np.searchsorted (bins, df ['процент']. Значения) print (df.groupby (df ['binnd']). size ()) ] оба метода вернут следующий вывод:
df['binned'] = np.searchsorted(bins, df['percentage'].values) print(df.groupby(df['binned']).size())
Этот вывод указывает, что в бункерах нет значений (0, 1], (1, 5], (5, 10] и (10, 25]. Три значения попадают в bin (25, 50], и одно значение попадает в мусорное ведро (50, 100].
]Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3