na análise de dados, geralmente é útil dividir dados em categorias para simplificar sua representação e análise. Esta é uma técnica comum ao trabalhar com dados numéricos, como ao lidar com porcentagens. ['porcentagem']. Head () 46.5 44.2 100.0 42.12
para bin esta coluna e obter a contagem de valor para cada compartimento, podemos usar a função pd.cut. Aqui estão duas maneiras de conseguir isso:
df['percentage'].head() 46.5 44.2 100.0 42.12usando pd.cut com value_counts:
bins = [0, 1, 5, 10, 25, 50, 100] df ['binned'] = pd.cut (df ['porcentagem'], caixas) print (df.groupby (df ['binned'])). size ())
usando np.searchsorted e groupby:df['percentage'].head() 46.5 44.2 100.0 42.12
df ['binned'] = np.searchSorted (Bins, df ['porcentagem']. print (df.groupby (df ['binned']). size ()) Ambos os métodos retornarão a seguinte saída:
df['binned'] = np.searchsorted(bins, df['percentage'].values) print(df.groupby(df['binned']).size())
Esta saída indica que não há valores nas caixas (0, 1], (1, 5], (5, 10] e (10, 25]. Três valores caem no bin (25, 50], e um valor cai na lixeira (50, 100].
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3