NumPy:有效率地選擇每行特定列索引
資料選擇是資料分析中至關重要的操作。使用 NumPy 陣列時,從每行中選擇特定列可能是一項常見任務。此選擇可以透過多種方法完成,但根據每行的索引清單選擇列需要更有效的方法。
使用布林數組進行直接選擇
如果您有一個布林數組來指示要選擇的列,則可以使用直接選擇來有效地提取所需的值。可以透過將索引清單與列範圍進行比較來建立布林數組。例如,給定問題中所述的矩陣 X 和索引 Y 列表,您可以建立一個布林數組 b,如下所示:
import numpy as np
X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
Y = np.array([1, 0, 2])
b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]
有了布林數組b,可以直接選擇:
result = X[np.arange(X.shape[0]), b]
此方法提供了一種基於布林數組選擇特定列的快速方法。
替代方法
或者,您可以使用 np.arange 並根據索引清單 Y 直接選擇。此方法涉及建立索引數組並從矩陣X 對應:
result = X[np.arange(X.shape[0]), Y]
結論
使用布林數組可以有效地在NumPy 中選擇每行的特定列索引。此方法提供基於索引清單的快速、直接的列選擇。對於大量數據,這種方法將比基於迭代的方法提供顯著的效能優勢。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3