Pandas DataFrame GroupBy Multiple Columns for Value Counts
Bei der DataFrame-Manipulation mit Pandas kann die Gruppierung von Daten nach mehreren Spalten wertvolle Erkenntnisse liefern. In diesem Artikel wird gezeigt, wie Beobachtungen beim Gruppieren nach zwei Spalten gezählt werden und wie die höchste Anzahl für jede Gruppierung ermittelt wird.
Bei einem DataFrame mit mehreren Spalten ist es möglich, die Funktion „groupby“ zum Gruppieren von Daten anzuwenden basierend auf bestimmten Spalten. Hier haben wir einen DataFrame namens „df“ mit fünf Spalten: „col1“, „col2“, „col3“, „col4“ und „col5“.
import pandas as pd
df = pd.DataFrame([
[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3],
list('AAABBBBABCBDDD'),
[1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8],
['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],
['1','3','3','2','4','2','5','3','6','3','5','1','1','1']
]).T
df.columns = ['col1','col2','col3','col4','col5']
Zählen nach Zeilengruppen
Zählen Anzahl der Beobachtungen in jeder Zeilengruppe, verwenden Sie die Funktion „groupby“ für die gewünschten Spalten und wenden Sie dann die „Größe“ an. function.
result = df.groupby(['col5', 'col2']).size()
Dies erzeugt einen DataFrame mit den gruppierten Spalten als Index und die Größe als Werte.
print(result)
Bestimmen des Höchsten Anzahl
Um die maximale Anzahl für jeden „col2“-Wert zu bestimmen, verwenden Sie die „groupby“-Funktion auf „col2“ und wenden Sie dann die „max“-Funktion auf die gruppierten Daten an.
result = df.groupby(['col5', 'col2']).size().groupby(level=1).max()
Dies erzeugt eine Serie mit der maximalen Anzahl für jeden „col2“-Wert.
print(result)
Zusammenfassend ermöglicht die Verwendung der Funktionen „groupby“ und „size“ in Pandas eine effiziente Analyse und Aggregation von Daten, die es Benutzern ermöglicht, auf verschiedene Weise Erkenntnisse über ihre Daten zu gewinnen.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3