Ermitteln des Maximums mehrerer Spalten in Pandas DataFrames
Bei der Datenanalyse ist das Ermitteln des Maximalwerts über mehrere Spalten hinweg eine häufige Aufgabe. In Python bietet die Pandas-Bibliothek effiziente Methoden zum Ausführen solcher Operationen.
Problemstellung:
Angenommen, Sie haben einen DataFrame mit den Spalten A und B und müssen dies tun Erstellen Sie eine neue Spalte C, in der jeder Wert das Maximum der entsprechenden Werte in den Spalten A und ist B.
Lösung:
Mit Pandas können Sie mithilfe der Max-Funktion ganz einfach das Maximum mehrerer Spalten berechnen. Die folgenden Schritte beschreiben, wie Spalte C erstellt wird:
import pandas as pd
Erstellen Sie einen DataFrame mit den Spalten A und B. Zum Beispiel:
df = pd.DataFrame({"A": [1, 2, 3], "B": [-2, 8, 1]})
Verwenden Sie die Max-Funktion für die Spalten, die Sie vergleichen möchten. und geben Sie axis=1 an, um das Maximum für jede Zeile zu berechnen:
max_values = df[["A", "B"]].max(axis=1)
Fügen Sie die berechneten Maximalwerte als neue Spalte C hinzu DataFrame:
df["C"] = max_values
Der resultierende DataFrame df hat jetzt drei Spalten: A, B und C, wobei Spalte C das Maximum der entsprechenden A und enthält B-Werte.
Vereinfachte Lösung (für nur zwei Spalten):
Wenn Sie nur zwei Spalten zum Vergleich haben, können Sie Sie können eine vereinfachte Version der obigen Lösung verwenden:
df["C"] = df.max(axis=1)
Dies setzt voraus, dass die Spalten A und B die einzigen Spalten im sind DataFrame.
Zusätzliche Hinweise:
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3