"Se um trabalhador quiser fazer bem o seu trabalho, ele deve primeiro afiar suas ferramentas." - Confúcio, "Os Analectos de Confúcio. Lu Linggong"
Primeira página > Programação > Como posso remover com eficiência linhas duplicadas em colunas específicas em pandas?

Como posso remover com eficiência linhas duplicadas em colunas específicas em pandas?

Postado em 2025-03-23
Navegar:695

How Can I Efficiently Remove Duplicate Rows Across Specific Columns in Pandas?

soltando linhas duplicadas em várias colunas em Python pandas

A PANDAS DOT_DUPLICATES FUNCTILIMINATA LOWS DULICADAS de um DataFrame, uma ferramenta invalida para Datansing. Para estender essa funcionalidade, pode -se especificar as colunas para verificar a singularidade. 0 foo 0 a 1 foo 1 a 2 foo 1 b 3 bar 1 a

Suponha que você queira remover linhas que tenham valores idênticos nas colunas 'a' e 'C.' Nesse caso, as linhas 0 e 1 seriam eliminadas. No entanto, com a função Drop_DUplicates aprimorada dos pandas, agora é uma brisa. A introdução do parâmetro de manutenção permite controlar como as duplicatas são tratadas. Ao definir o False, você instrui os pandas a eliminar todas as linhas duplicadas:

    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A

output:

a b c 2 foo 1 b 3 bar 1 a

Como você pode ver, as linhas 0 e 1 são removidas com sucesso, deixando apenas as linhas únicas com base nos valores nas colunas 'a' e 'c.'

Tutorial mais recente Mais>

Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.

Copyright© 2022 湘ICP备2022001581号-3