NumPy:高效选择每行特定列索引
数据选择是数据分析中至关重要的操作。使用 NumPy 数组时,从每行中选择特定列可能是一项常见任务。此选择可以通过多种方法完成,但根据每行的索引列表选择列需要更有效的方法。
使用布尔数组进行直接选择
如果您有一个布尔数组来指示要选择的列,则可以使用直接选择来有效地提取所需的值。可以通过将索引列表与列范围进行比较来创建布尔数组。例如,给定问题中所述的矩阵 X 和索引 Y 列表,您可以创建一个布尔数组 b,如下所示:
import numpy as np
X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
Y = np.array([1, 0, 2])
b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]
有了布尔数组b,可以直接选择:
result = X[np.arange(X.shape[0]), b]
此方法提供了一种基于布尔数组选择特定列的快速方法。
替代方法
或者,您可以使用 np.arange 并根据索引列表 Y 直接选择。此方法涉及创建索引数组并从矩阵 X 相应:
result = X[np.arange(X.shape[0]), Y]
结论
使用布尔数组可以有效地在 NumPy 中选择每行的特定列索引。此方法提供基于索引列表的快速、直接的列选择。对于大量数据,这种方法将比基于迭代的方法提供显着的性能优势。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3