pandas rehapant long à large par deux variables
manipulant les données entre les formats longs et larges est une tâche commune dans l'analyse des données. Dans la bibliothèque Pandas de Python, les opérations de fusion et de pile / démêler sont couramment utilisées à cet effet. Cependant, certains scénarios peuvent survenir lorsqu'une approche plus simple est souhaitée.
Un tel scénario est lors du remodelage des données qui incluent deux variables (par exemple, une variable numérique comme les ventes et une variable catégorique comme un produit) dans un format large . L'utilisation de méthodes Melt / Stack / Unstack seule peut ne pas fournir la sortie souhaitée.
Dans cet exemple, nous avons des données "longues" avec les colonnes suivantes: vendeur, hauteur, produit et prix. Notre objectif est de remodeler ces données dans un format "large" avec des colonnes pour chaque produit unique, y compris son prix correspondant.
Salesman Height product price Knut 6 bat 5 Knut 6 ball 1 Knut 6 wand 3 Steve 5 pen 2
Pour ce faire, nous pouvons tirer parti de la fonction PIVOT de Pandas, qui fournit un moyen pratique de créer des tables de pivot. Nous spécifions la colonne d'index (vendeur), les colonnes de pivot (obs) et les valeurs colonnes (prix).
Voici le code python pour remodeler les données:
wide_df = df.pivot(index='Salesman', columns='product', values='price')
Cela produira le format "large" "large" Knut 6 bat 5 balle 1 baguette 3 Steve 5 Pen 2 na na na na
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3