NumPy: 행당 특정 열 인덱스의 효율적인 선택
데이터 선택은 데이터 분석에서 중요한 작업입니다. NumPy 배열로 작업할 때 각 행에서 특정 열을 선택하는 것은 일반적인 작업이 될 수 있습니다. 이 선택은 다양한 방법으로 수행할 수 있지만 행당 인덱스 목록을 기반으로 열을 선택하려면 보다 효율적인 접근 방식이 필요합니다.
직접 선택을 위해 부울 배열 사용
선택할 열을 나타내는 부울 배열이 있는 경우 직접 선택을 사용하여 원하는 값을 효율적으로 추출할 수 있습니다. 부울 배열은 인덱스 목록과 열 범위를 비교하여 만들 수 있습니다. 예를 들어, 질문에 설명된 대로 행렬 X와 인덱스 목록 Y가 주어지면 다음과 같이 부울 배열 b를 만들 수 있습니다.
import numpy as np
X = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
Y = np.array([1, 0, 2])
b = np.arange(X.shape[1])[np.isin(np.arange(X.shape[1]), Y)]
부울 배열 b를 사용하면 직접 선택이 가능합니다. :
result = X[np.arange(X.shape[0]), b]
이 방법은 부울 배열을 기반으로 특정 열을 선택하는 빠른 방법을 제공합니다.
대체 방법
또는 np.arange를 사용하고 인덱스 목록 Y를 기반으로 직접 선택할 수 있습니다. 이 접근 방식에는 인덱스 배열을 만들고 다음에서 선택하는 작업이 포함됩니다. 그에 따라 행렬 X:
result = X[np.arange(X.shape[0]), Y]
결론
NumPy에서 행당 특정 열 인덱스를 선택하는 것은 부울 배열을 사용하여 효율적으로 수행할 수 있습니다. 이 방법을 사용하면 인덱스 목록을 기반으로 빠르고 간단하게 열을 선택할 수 있습니다. 대규모 데이터 배열의 경우 이 접근 방식은 반복 기반 방법에 비해 상당한 성능 이점을 제공합니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3