So summieren Sie DataFrame-Zeilen für bestimmte Spalten in Pandas
Für einen bestimmten DataFrame kann es erforderlich sein, die Summe der Werte zu berechnen bestimmte Zeilen. Beim Versuch, dies über df[['a', 'b', 'd']].map(sum) zu erreichen, können Probleme auftreten.
Der geeignete Vorgang für diese Aufgabe umfasst die Verwendung von sum() mit Achse=1. Diese Operation berechnet die Summe jeder Zeile und ignoriert nicht numerische Spalten. Um die Genauigkeit sicherzustellen, wird empfohlen, numeric_only=True anzugeben, insbesondere in Pandas-Versionen 2.0 und höher.
Betrachten Sie beispielsweise einen DataFrame mit den Spalten „a“, „b“, „c“ und „d“. , wobei 'c' eine nicht numerische Spalte ist:
df = pd.DataFrame({'a': [1, 2, 3], 'b': [2, 3, 4], 'c': ['dd', 'ee', 'ff'], 'd': [5, 9, 1]})
Um die Summe von zu berechnen Spalten 'a', 'b' und 'd' können wir verwenden:
df['e'] = df.sum(axis=1, numeric_only=True)
Dadurch wird eine Spalte „e“ hinzugefügt, die die Summe der gewünschten Spalten enthält.
Wenn Sie bestimmte Spalten summieren und andere ausschließen möchten, können Sie eine Liste von Spalten angeben und entfernen Sie alle unerwünschten mit col_list.remove(column_name).
col_list = list(df) col_list.remove('d') df['e'] = df[col_list].sum(axis=1)
Dadurch wird eine neue Spalte „e“ mit der Summe der angegebenen Spalten erstellt.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3