Adicionar coluna ao GroupBy DataFrame usando Pandas Transform
Ao trabalhar com operações groupby em pandas, geralmente é útil adicionar uma nova coluna ao quadro de dados resultante. Um método para fazer isso é usar a função .map(), conforme demonstrado no exemplo. No entanto, uma abordagem alternativa e mais direta é empregar a função .transform().
.transform() nos permite aplicar uma função a cada grupo no dataframe e retornar uma série com os resultados. A série retornada terá um índice alinhado ao dataframe original.
Para ilustrar, vamos começar com o dataframe fornecido:
df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})
Nosso objetivo é contar os valores do tipo para cada c e adicionar uma coluna com o tamanho de c.
g = df.groupby('c')['type'].value_counts().reset_index(name='t')
Este código conta os valores de cada grupo e cria uma nova coluna chamada t.
Para adicionar a coluna de tamanho usando .transform(), podemos faça o seguinte:
g['size'] = df.groupby('c')['type'].transform('size')
.transform('size') aplica a função size a cada grupo, que retorna o tamanho de cada grupo. A série resultante está alinhada com o índice do dataframe original, permitindo-nos adicioná-la como uma nova coluna a g.
A saída será um dataframe com uma coluna adicional chamada size:
c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4
Usar .transform() fornece uma maneira mais concisa e direta de adicionar uma coluna de volta ao dataframe original a partir de uma agregação groupby.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3