"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Como posso dinamizar efetivamente um DataFrame do Pandas?

Como posso dinamizar efetivamente um DataFrame do Pandas?

Publicado em 2024-12-21
Navegar:495

How Can I Effectively Pivot a Pandas DataFrame?

Como posso dinamizar um dataframe?

Um pivô é uma transformação que pega um dataframe com colunas que representam categorias e linhas que representam valores, e o reorienta para que as categorias estão nas linhas, os valores estão nas colunas e o índice é definido com os valores originais da linha.

Básico sintaxe:

df.pivot(index=, columns=, values=)

Exemplos:

  • Girar em um único coluna:
df.pivot(index='row', columns='col', values='val')
  • Pivot em múltiplas colunas:
df.pivot(index=['row', 'item'], columns='col', values='val')
  • Pivot em vários valores:
df.pivot(index='row', columns='col', values=['val0', 'val1'])
  • Pivot com agregação personalizada funções:
df.pivot(index='row', columns='col', values='val', aggfunc='mean')
  • Tratamento de duplicatas chaves:

Por padrão, se houver chaves duplicadas nos rótulos de linha ou coluna, um erro será gerado. Alternativamente, você pode usar:

df.pivot_table(index='row', columns='col', values='val', fill_value=0)
  • Outros métodos para pivoting:
  • groupby unstack:

    df.groupby('row', 'col')['val'].mean().unstack(fill_value=0)
  • pd.DataFrame.set_index: Use set_index para definir os eixos de linha e coluna e, em seguida, desempilhar para dinamizar.
  • pd.crosstab: projetado especificamente para criar tabelas cruzadas ou tabelas dinâmicas.

Pivotagem avançada Técnicas:

  • Tabulação cruzada (contagem de frequência):
pd.crosstab(index=df['row'], columns=df['col'], values=df['val'], aggfunc='count')
  • Agregação múltipla funções:
df.pivot_table(index='row', columns='col', values='val', aggfunc=['mean', 'sum'])
  • Subdividindo por múltiplas colunas:
df.pivot_table(index='row', columns=['item', 'col'], values='val', fill_value=0, aggfunc='mean')
Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3