Comment puis-je supprimer efficacement les lignes en double à travers des colonnes spécifiques dans les pandas?

Page de garde > La programmation > Comment puis-je supprimer efficacement les lignes en double à travers des colonnes spécifiques dans les pandas?

Comment puis-je supprimer efficacement les lignes en double à travers des colonnes spécifiques dans les pandas?

Publié le 2025-03-23

Parcourir:802

How Can I Efficiently Remove Duplicate Rows Across Specific Columns in Pandas?

supprimant des lignes en double à travers plusieurs colonnes dans Python pandas

La fonction Pandas Drop_duplicate élimine les lignes dupliquées à partir d'un dataframe, un outil précieux pour le nettoyage des données. Pour étendre cette fonctionnalité, on peut spécifier les colonnes pour vérifier l'unicité.

Par exemple, considérez le dataframe suivant:

    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A

Supposons que vous souhaitiez supprimer les lignes qui ont des valeurs identiques dans les colonnes «A» et «C.» Dans ce cas, les lignes 0 et 1 seraient éliminées.

Auparavant, cette tâche requise le filtrage manuel ou les opérations complexes. Cependant, avec la fonction Drop_duplicate améliorée de Pandas, c'est maintenant un jeu d'enfant. L'introduction du paramètre Keep vous permet de contrôler comment les doublons sont gérés.

pour déposer des lignes qui correspondent à des colonnes spécifiques, utilisez le paramètre de sous-ensemble. En définissant Keep to False, vous demandez à Pandas d'éliminer toutes les lignes en double:

import pandas as pd
df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})
df.drop_duplicates(subset=['A', 'C'], keep=False)

output:

    A   B   C
2   foo 1   B
3   bar 1   A

Comme vous pouvez le voir, les lignes 0 et 1 sont supprimées avec succès, ne laissant que les lignes uniques en fonction des valeurs des colonnes 'a' et 'c.'

Dernier tutoriel Plus>

Comment limiter la plage de défilement d'un élément dans un élément parent de taille dynamique?
Implémentation de limites de hauteur CSS pour les éléments de défilement vertical dans une interface interactive, le contrôle du comportement ...

La programmation Publié le 2025-03-24
Comprimer et décompresser des fichiers en java
Cet article explore la compression et la décompression des fichiers en java, en se concentrant sur les classes deflaterOutStream et flaterinput...

La programmation Publié le 2025-03-24
$Pourquoi est-ce que je reçois une erreur \ "class \ 'ziparchive \' non trouvée \" après avoir installé archive_zip sur mon serveur Linux?$
Pourquoi est-ce que je reçois une erreur \ "class \ 'ziparchive \' non trouvée \" après avoir installé archive_zip sur mon serveur Linux?
classe 'ziparchive' introuvable erreur lors de l'installation d'archive_zip sur le serveur Linux symptôme: Lorsque vous tent...

La programmation Publié le 2025-03-24
Puis-je migrer mon cryptage de McRypt à OpenSSL et décrypter les données cryptées McRypt à l'aide d'OpenSSL?
Mise à niveau de ma bibliothèque de chiffrement de McRypt à OpenSSL Puis-je mettre à niveau ma bibliothèque de cryptage à partir de McRypt à O...

La programmation Publié le 2025-03-24
Quelle méthode pour déclarer plusieurs variables en JavaScript est plus maintenable?
déclarant plusieurs variables dans javascript: explorant deux méthodes dans javascript, les développeurs rencontrent souvent la nécessité de d...

La programmation Publié le 2025-03-24
Comment puis-je combiner efficacement Flexbox et un défilement vertical dans une disposition à pleine hauteur?
Intégration de flexbox et de défilement vertical dans une mise en page à pleine hauteur lorsque vous travaillez avec des applications pleine h...

La programmation Publié le 2025-03-24
Comment puis-je styliser la première instance d'un type d'élément spécifique sur un document HTML entier?
correspondant au premier élément d'un certain type dans tout le document Styling Le premier élément d'un type spécifique à travers un...

La programmation Publié le 2025-03-24
Comment résoudre les écarts de chemin du module dans GO Mod en utilisant la directive Remplacer?
surmonter la divergence du chemin du module dans go mod Lors de l'utilisation de Go Mod, il est possible de rencontrer un conflit où un pa...

La programmation Publié le 2025-03-24
Pourquoi les images affichent-elles des images à l'aide de la propriété CSS «Content»?
Affichage des images avec URL de contenu dans Firefox Un problème a été rencontré lorsque certains navigateurs, spécifiquement Firefox, n'...

La programmation Publié le 2025-03-24
Quelles ont été les restrictions sur l'utilisation de Current_timestamp avec des colonnes horodatotes dans MySQL avant la version 5.6.5?
Restrictions sur les colonnes horodat Clause actuelle_timestamp. Cette limitation s'est étendue aux entiers INT, BigInt et SmallInt lorsqu'...

La programmation Publié le 2025-03-24
Comment surmonter les restrictions de redéfinition de la fonction de PHP?
surmonter les limitations de redéfinition de la fonction de Php dans php, définir une fonction avec le même nom plusieurs fois est un non. Ten...

La programmation Publié le 2025-03-24
Comment envoyer une demande de poste brut avec curl en php?
Comment envoyer une demande de message brut à l'aide de curl dans php dans php, Curl est une bibliothèque populaire pour envoyer des deman...

La programmation Publié le 2025-03-24
Trouver des bourses de développement frontal
Financement d'une éducation au développement Web frontal peut être difficile. Alors que de nombreux développeurs en herbe explorent divers par...

La programmation Publié le 2025-03-24
Http_host vs server_name en php: que devez-vous utiliser?
http_host vs server_name en php lorsqu'ils traitent des en-têtes http en php, deux variables, $ _server ['http_host'] et $ _server...

La programmation Publié le 2025-03-24
Comment capturer et diffuser Stdout en temps réel pour l'exécution de la commande chatbot?
Capturant stdout en temps réel à partir de l'exécution de commandes dans le domaine de l'élaboration de chatbots capables d'exécut...

La programmation Publié le 2025-03-24

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article