"Si un ouvrier veut bien faire son travail, il doit d'abord affûter ses outils." - Confucius, "Les Entretiens de Confucius. Lu Linggong"
Page de garde > La programmation > Comment sélectionner efficacement des index de colonnes spécifiques par ligne dans NumPy ?

Comment sélectionner efficacement des index de colonnes spécifiques par ligne dans NumPy ?

Publié le 2024-11-01
Parcourir:665

How to Efficiently Select Specific Column Indexes per Row in NumPy?

NumPy : sélection efficace d'index de colonnes spécifiques par ligne

La sélection des données est une opération cruciale dans l'analyse des données. Lorsque vous travaillez avec des tableaux NumPy, la sélection de colonnes spécifiques de chaque ligne peut être une tâche courante. Cette sélection peut être effectuée avec différentes méthodes, mais la sélection de colonnes basée sur une liste d'index par ligne nécessite une approche plus efficace.

Utilisation de tableaux booléens pour la sélection directe

Si vous disposez d'un tableau booléen indiquant les colonnes à sélectionner, vous pouvez utiliser la sélection directe pour extraire efficacement les valeurs souhaitées. Des tableaux booléens peuvent être créés en comparant une liste d'index avec la plage de colonnes. Par exemple, étant donné une matrice X et une liste d'index Y comme décrit dans la question, vous pouvez créer un tableau booléen b comme suit :

import numpy as np

X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
Y = np.array([1, 0, 2])
b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]

Avec le tableau booléen b, une sélection directe peut être effectuée :

result = X[np.arange(X.shape[0]), b]

Cette méthode fournit un moyen rapide de sélectionner des colonnes spécifiques en fonction de le tableau booléen.

Méthodes alternatives

Vous pouvez également utiliser np.arange et une sélection directe basée sur la liste d'index Y. Cette approche implique la création d'un tableau d'index et en sélectionnant dans la matrice X en conséquence :

result = X[np.arange(X.shape[0]), Y]

Conclusion

La sélection d'index de colonnes spécifiques par ligne dans NumPy peut être effectuée efficacement à l'aide de tableaux booléens. Cette méthode permet une sélection rapide et simple de colonnes basée sur une liste d'index. Pour de larges tableaux de données, cette approche offrira des avantages significatifs en termes de performances par rapport aux méthodes basées sur les itérations.

Dernier tutoriel Plus>

Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.

Copyright© 2022 湘ICP备2022001581号-3