Sortieren eines Pandas-Datenrahmens nach mehreren Spalten
Das Sortieren eines Pandas-Datenrahmens nach mehreren Spalten ist ein häufiger Vorgang in der Datenanalyse. Stellen Sie sich einen Datenrahmen mit den Spalten „a“, „b“ und „c“ vor. Um diesen Datenrahmen nach Spalte „b“ in aufsteigender Reihenfolge und Spalte „c“ in absteigender Reihenfolge zu sortieren, führen Sie die folgenden Schritte aus:
Ab Pandas-Version 0.17.0 ist die Sortiermethode zugunsten von sort_values veraltet. Ab Version 0.20.0 wurde die Sortierung vollständig entfernt. Die Argumente und Ergebnisse bleiben jedoch unverändert:
df.sort_values(['a', 'b'], ascending=[True, False])
Eine äquivalente Methode mit der veralteten Sortierung Methode ist:
df.sort(['a', 'b'], ascending=[True, False])
For Betrachten Sie beispielsweise einen Datenrahmen df1 mit zufälligen Ganzzahlwerten in den Spalten „a“ und „b“:
import pandas as pd import numpy as np df1 = pd.DataFrame(np.random.randint(1, 5, (10, 2)), columns=['a', 'b'])
Dieser Datenrahmen wird aufsteigend nach „a“ sortiert order und 'b' in absteigender Reihenfolge ergibt:
df1.sort(['a', 'b'], ascending=[True, False])
a b 2 1 4 7 1 3 1 1 2 3 1 2 4 3 2 6 4 4 0 4 3 9 4 3 5 4 1 8 4 1
Denken Sie daran, dass die Sortiermethode standardmäßig nicht vorhanden ist. Um df1 mit den sortierten Werten zu aktualisieren, weisen Sie df1 das Ergebnis der Sortiermethode zu oder verwenden Sie inplace=True im Methodenaufruf:
df1 = df1.sort(['a', 'b'], ascending=[True, False])
or
df1.sort(['a', 'b'], ascending=[True, False], inplace=True)
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3