"Si un trabajador quiere hacer bien su trabajo, primero debe afilar sus herramientas." - Confucio, "Las Analectas de Confucio. Lu Linggong"
Página delantera > Programación > ¿Cómo puedo eliminar eficientemente las filas duplicadas a través de columnas específicas en pandas?

¿Cómo puedo eliminar eficientemente las filas duplicadas a través de columnas específicas en pandas?

Publicado el 2025-03-23
Navegar:915

How Can I Efficiently Remove Duplicate Rows Across Specific Columns in Pandas?

duplicar filas a través de múltiples columnas en python pandas

la función pandas drop_dupplate elimina las filas duplicadas de un marco de datos, una herramienta invaluable para la limpieza de datos. Para extender esta funcionalidad, se puede especificar las columnas para verificar si hay singularidad.

, por ejemplo, considere el siguiente DataFrame:

    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A

Suponga que desea eliminar filas que tienen valores idénticos en las columnas 'A' y 'C.' En este caso, las filas 0 y 1 serían eliminadas.

Anteriormente, esta tarea requería filtrado manual o operaciones complejas. Sin embargo, con la función de drop_duplicate mejorada de Pandas, ahora es una brisa. La introducción del parámetro Keep le permite controlar cómo se manejan los duplicados.

para soltar filas que coincidan en columnas específicas, use el parámetro de subconjunto. Al establecer mantenerse en falso, le indica a los pandas que eliminen todas las filas duplicadas:

import pandas as pd
df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)

output:

    A   B   C
2   foo 1   B
3   bar 1   A

Como puede ver, las filas 0 y 1 se eliminan con éxito, dejando solo las filas que son únicas según los valores en las columnas 'A' y 'C.'

Último tutorial Más>

Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.

Copyright© 2022 湘ICP备2022001581号-3