」工欲善其事,必先利其器。「—孔子《論語.錄靈公》
首頁 > 程式設計 > 如何在 NumPy 中有效地選擇每行的特定列索引?

如何在 NumPy 中有效地選擇每行的特定列索引?

發佈於2024-11-01
瀏覽:503

How to Efficiently Select Specific Column Indexes per Row in NumPy?

NumPy:有效率地選擇每行特定列索引

資料選擇是資料分析中至關重要的操作。使用 NumPy 陣列時,從每行中選擇特定列可能是一項常見任務。此選擇可以透過多種方法完成,但根據每行的索引清單選擇列需要更有效的方法。

使用布林數組進行直接選擇

如果您有一個布林數組來指示要選擇的列,則可以使用直接選擇來有效地提取所需的值。可以透過將索引清單與列範圍進行比較來建立布林數組。例如,給定問題中所述的矩陣 X 和索引 Y 列表,您可以建立一個布林數組 b,如下所示:

import numpy as np

X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
Y = np.array([1, 0, 2])
b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]

有了布林數組b,可以直接選擇:

result = X[np.arange(X.shape[0]), b]

此方法提供了一種基於布林數組選擇特定列的快速方法。

替代方法

或者,您可以使用 np.arange 並根據索引清單 Y 直接選擇。此方法涉及建立索引數組並從矩陣X 對應:

result = X[np.arange(X.shape[0]), Y]

結論

使用布林數組可以有效地在NumPy 中選擇每行的特定列索引。此方法提供基於索引清單的快速、直接的列選擇。對於大量數據,這種方法將比基於迭代的方法提供顯著的效能優勢。

最新教學 更多>

免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。

Copyright© 2022 湘ICP备2022001581号-3