„Wenn ein Arbeiter seine Arbeit gut machen will, muss er zuerst seine Werkzeuge schärfen.“ – Konfuzius, „Die Gespräche des Konfuzius. Lu Linggong“
Titelseite > Programmierung > Wie führt man mit Pandas DataFrame GroupBy Wertzählungen durch und ermittelt die maximale Anzahl für mehrere Spalten?

Wie führt man mit Pandas DataFrame GroupBy Wertzählungen durch und ermittelt die maximale Anzahl für mehrere Spalten?

Veröffentlicht am 11.11.2024
Durchsuche:730

How to Perform Value Counts and Find Maximum Counts for Multiple Columns Using Pandas DataFrame GroupBy?

Pandas DataFrame GroupBy Multiple Columns for Value Counts

Bei der DataFrame-Manipulation mit Pandas kann die Gruppierung von Daten nach mehreren Spalten wertvolle Erkenntnisse liefern. In diesem Artikel wird gezeigt, wie Beobachtungen beim Gruppieren nach zwei Spalten gezählt werden und wie die höchste Anzahl für jede Gruppierung ermittelt wird.

Bei einem DataFrame mit mehreren Spalten ist es möglich, die Funktion „groupby“ zum Gruppieren von Daten anzuwenden basierend auf bestimmten Spalten. Hier haben wir einen DataFrame namens „df“ mit fünf Spalten: „col1“, „col2“, „col3“, „col4“ und „col5“.

import pandas as pd

df = pd.DataFrame([
    [1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], 
    list('AAABBBBABCBDDD'), 
    [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], 
    ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],
    ['1','3','3','2','4','2','5','3','6','3','5','1','1','1']
]).T
df.columns = ['col1','col2','col3','col4','col5']

Zählen nach Zeilengruppen

Zählen Anzahl der Beobachtungen in jeder Zeilengruppe, verwenden Sie die Funktion „groupby“ für die gewünschten Spalten und wenden Sie dann die „Größe“ an. function.

result = df.groupby(['col5', 'col2']).size()

Dies erzeugt einen DataFrame mit den gruppierten Spalten als Index und die Größe als Werte.

print(result)

Bestimmen des Höchsten Anzahl

Um die maximale Anzahl für jeden „col2“-Wert zu bestimmen, verwenden Sie die „groupby“-Funktion auf „col2“ und wenden Sie dann die „max“-Funktion auf die gruppierten Daten an.

result = df.groupby(['col5', 'col2']).size().groupby(level=1).max()

Dies erzeugt eine Serie mit der maximalen Anzahl für jeden „col2“-Wert.

print(result)

Zusammenfassend ermöglicht die Verwendung der Funktionen „groupby“ und „size“ in Pandas eine effiziente Analyse und Aggregation von Daten, die es Benutzern ermöglicht, auf verschiedene Weise Erkenntnisse über ihre Daten zu gewinnen.

Freigabeerklärung Dieser Artikel wird unter folgender Adresse abgedruckt: 1729650500 Bei Verstößen wenden Sie sich bitte an [email protected], um ihn zu löschen
Neuestes Tutorial Mehr>

Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.

Copyright© 2022 湘ICP备2022001581号-3