Création d'une colonne conditionnelle : If-Elif-Else dans Pandas
Le problème donné demande qu'une nouvelle colonne soit ajoutée à un DataFrame basée sur une série de critères conditionnels. Le défi réside dans la mise en œuvre de ces conditions tout en maintenant l'efficacité et la lisibilité du code.
Solution utilisant une application de fonction
Une approche consiste à créer une fonction qui mappe chaque ligne au résultat souhaité. basé sur les conditions :
def f(row):
if row['A'] == row['B']:
return 0
elif row['A'] > row['B']:
return 1
else:
return -1
df['C'] = df.apply(f, axis=1)
Cette méthode est lisible et facile à mettre en œuvre, mais elle n'est pas vectorisée et peut entraîner des problèmes de performances avec de grands ensembles de données.
Solution vectorisée
Pour plus d'efficacité, une approche vectorisée utilisant la fonction np.where de NumPy est recommandée :
df['C'] = np.where(
df['A'] == df['B'], 0, np.where(
df['A'] > df['B'], 1, -1))
Cette opération effectue la sélection conditionnelle élément par élément sur le DataFrame, résultant en une nouvelle colonne avec les valeurs souhaitées.
Cette approche vectorisée offre des avantages significatifs en termes de performances par rapport à la méthode basée sur les fonctions. Il permet également une mise en œuvre plus concise et lisible des critères conditionnels.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3