pandas, die lange bis breit um zwei Variablen umgestaltet werden
Die Manipulation von Daten zwischen langen und breiten Formaten ist eine häufige Aufgabe in der Datenanalyse. In Pythons Pandas -Bibliothek werden für diesen Zweck üblicherweise Melt- und Stapel-/Unstapeloperationen verwendet. Es können jedoch bestimmte Szenarien entstehen, bei denen ein einfacherer Ansatz gewünscht wird.
Ein solches Szenario ist, wenn Daten umformieren, die zwei Variablen (z. B. eine numerische Variable wie Verkauf und eine kategoriale Variable wie Produkt) in ein breites Format enthalten . Mit Melt/Stack/Unstack -Methoden allein kann nicht die gewünschte Ausgabe angeben.
In diesem Beispiel haben wir "lange" Daten mit den folgenden Spalten: Verkäufer, Höhe, Produkt und Preis. Unser Ziel ist es, diese Daten in ein "breites" Format mit Spalten für jedes einzigartige Produkt umzuwandeln, einschließlich des entsprechenden Preis Knut 6 BAT 5 Knut 6 Ball 1 Knut 6 Zauberstab 3 Steve 5 Pen 2
Salesman Height product price Knut 6 bat 5 Knut 6 ball 1 Knut 6 wand 3 Steve 5 pen 2
Hier ist der Python -Code, um die Daten zu formulieren:
wide_df = df. pivot (index = 'salesman', columns = 'product', values = 'price')
wide_df = df.pivot(index='Salesman', columns='product', values='price')
Salesman Height Product_1 Price_1 Product_2 Price_2 Product_3 Price_3 Knut 6 BAT 5 Ball 1 Zauberstab 3 Steve 5 Pen 2 na na na
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3