Como posso manter outras colunas em um DataFrame do Pandas durante uma operação groupby?

Primeira página > Programação > Como posso manter outras colunas em um DataFrame do Pandas durante uma operação groupby?

Como posso manter outras colunas em um DataFrame do Pandas durante uma operação groupby?

Publicado em 2024-11-08

Navegar:239

How can I maintain other columns in a Pandas DataFrame during a groupby operation?

Mantendo outras colunas durante operações Groupby

Ao executar uma operação groupby em um dataframe do pandas, muitas vezes é necessário reter colunas que não são envolvidos no processo de agrupamento ou agregação. Por padrão, essas outras colunas são eliminadas quando a operação é concluída. Isso pode ser problemático se as colunas retidas contiverem informações valiosas.

Considere o seguinte quadro de dados:

    item    diff   otherstuff
   0   1       2            1
   1   1       1            2
   2   1       3            7
   3   2      -1            0
   4   2       1            3
   5   2       4            9
   6   2      -6            2
   7   3       0            0
   8   3       2            9

Se agrupássemos o quadro de dados pela coluna "item" e encontrássemos o valor mínimo da coluna "diff", o quadro de dados resultante ficaria assim:

    item   diff
   0   1      1           
   1   2     -6           
   2   3      0

Observe que a coluna "outras coisas" foi eliminada. Para reter esta coluna, podemos usar o método idxmin() para obter os índices dos elementos de diferença mínima e, em seguida, selecionar aqueles:

>>> df.loc[df.groupby("item")["diff"].idxmin()]
   item  diff  otherstuff
1     1     1           2
6     2    -6           2
7     3     0           0

[3 rows x 3 columns]

Outro método é classificar o quadro de dados pela coluna "diff" e, em seguida, pegar o primeiro elemento em cada grupo de itens:

>>> df.sort_values("diff").groupby("item", as_index=False).first()
   item  diff  otherstuff
0     1     1           2
1     2    -6           2
2     3     0           0

[3 rows x 3 columns]

Ambos os métodos produzirão o resultado desejado, mantendo a coluna "outras coisas". Tenha em mente que os índices resultantes podem ser diferentes, mesmo que o conteúdo da linha seja o mesmo.

Tutorial mais recente Mais>

Qual método é mais eficiente para a detecção de ponto em polígono: rastreamento de raio ou path.contains_points?
detecção de ponto-em-polígono eficiente em python determinar se um ponto está dentro de um polígono é uma tarefa frequente na geometria computac...

Programação Postado em 2025-04-19
Vários elementos pegajosos podem ser empilhados um no outro em CSS puro?
É possível ter vários elementos pegajosos empilhados um no outro em CSS puro? O comportamento desejado pode ser visto Aqui: https://webtheme...

Programação Postado em 2025-04-19
Como faço para selecionar com eficiência colunas nos quadros de dados do pandas?
Selecionando colunas em pandas DataFrames Ao lidar com tarefas de manipulação de dados, a seleção de colunas específicas se torna necessária. ...

Programação Postado em 2025-04-19
Como analisar números na notação exponencial usando decimal.parse ()?
analisando um número da notação exponencial ao tentar analisar uma string expressa em anotação exponencial usando Decimal.parse ("1.2345e...

Programação Postado em 2025-04-19
Como posso recuperar com eficiência valores de atributo de arquivos XML usando PHP?
recuperando valores do atributo dos arquivos xml em php todo desenvolvedor encontra a necessidade de analisar arquivos xml e extrair valores e...

Programação Postado em 2025-04-19
Como modificar efetivamente o atributo CSS do pseudo-elemento ": depois" usando jQuery?
Entendendo as limitações dos pseudo-elementos no jQuery: acessar o ": depois" seletor no desenvolvimento da web, pseudo-elementos co...

Programação Postado em 2025-04-19
Qual método para declarar várias variáveis em JavaScript é mais sustentável?
declarando várias variáveis em javascript: explorando dois métodos em javascript, os desenvolvedores geralmente encontram a necessidade de d...

Programação Postado em 2025-04-19
Como posso unindo tabelas de banco de dados com diferentes números de colunas?
tabelas combinadas com diferentes colunas ] pode encontrar desafios ao tentar mesclar tabelas de banco de dados com colunas diferentes. Uma man...

Programação Postado em 2025-04-19
Variedade
Os métodos são FNs que podem ser chamados em objetos Matrizes são objetos, portanto, eles também têm métodos no JS. Flice (Begin): Extra...

Programação Postado em 2025-04-19
Como detectar com eficiência matrizes vazias no PHP?
verificando o vazio da matriz em php Uma matriz vazia pode ser determinada em PHP através de várias abordagens. Se a necessidade é verificar a...

Programação Postado em 2025-04-19
Como os desenvolvedores de Java protegem as credenciais do banco de dados da decompilação?
protegendo as credenciais do banco de dados da decompilação em java em java, os arquivos de classe de decomposição são relativamente simples. ...

Programação Postado em 2025-04-19
Por que não está aparecendo na minha imagem de fundo do CSS?
SOLHAÇÃO DE TRABALHO: CSS Imagem de fundo não apareceu Você encontrou um problema em que sua imagem em segundo plano falha, apesar das seguint...

Programação Postado em 2025-04-19
Por que o Microsoft Visual C ++ falha ao implementar corretamente a instanciação do modelo bifásico?
O mistério do modelo de duas fases "quebrado" bifásia instanciação no Microsoft Visual C Declaração de Problema: STRAGLES Expressa...

Programação Postado em 2025-04-19
$Como resolver o erro \ "Uso inválido da função do grupo \" no MySQL ao encontrar a contagem máxima?$
Como resolver o erro \ "Uso inválido da função do grupo \" no MySQL ao encontrar a contagem máxima?
como recuperar a contagem máxima usando o mysql em mysql, você pode encontrar um problema enquanto tenta encontrar a contagem máxima de valore...

Programação Postado em 2025-04-19
Como posso manter a renderização de células JTable personalizada após a edição de células?
MANAZENDO JTABLE CELUMENTE renderização após a célula edit em uma jtable, implementar capacidades de renderização e edição de células personal...

Programação Postado em 2025-04-19

Classificação Mais>

Aprenda japonês Aprender coreano Aprenda chinês Aprender língua estrangeira Jogo Problema comum Periféricos de tecnologia IA Tutorial de software Programação Artigo