조건부 열 생성: Pandas의 If-Elif-Else
주어진 문제에서는 DataFrame에 새 열을 추가해야 합니다. 일련의 조건부 기준을 기반으로 합니다. 문제는 코드 효율성과 가독성을 유지하면서 이러한 조건을 구현하는 것입니다.
함수 적용을 사용한 솔루션
한 가지 접근 방식은 각 행을 원하는 결과에 매핑하는 함수를 만드는 것입니다. 조건에 따라:
def f(row):
if row['A'] == row['B']:
return 0
elif row['A'] > row['B']:
return 1
else:
return -1
df['C'] = df.apply(f, axis=1)
이 메서드는 읽기 쉽고 구현하기 쉽지만 벡터화되지 않으며 대규모 데이터 세트에서 성능 문제가 발생할 수 있습니다.
벡터화된 솔루션
효율성을 위해 NumPy의 np.where 함수를 사용하는 벡터화된 접근 방식을 권장합니다:
df['C'] = np.where(
df['A'] == df['B'], 0, np.where(
df['A'] > df['B'], 1, -1))
이 작업은 DataFrame에서 요소별로 조건부 선택을 수행하여 원하는 값이 있는 새 열을 생성합니다.
이 벡터화된 접근 방식은 함수 기반 방법에 비해 상당한 성능 이점을 제공합니다. 또한 조건부 기준을 보다 간결하고 읽기 쉽게 구현할 수 있습니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3