열 A에서 중복 항목을 제거할 때 가장 높은 B 값을 갖는 행 유지
현재 작업에는 열 A의 중복 값을 제거하는 작업이 포함됩니다. B 열에서 가장 높은 값을 가진 행을 유지하면서 데이터 프레임을 만듭니다. 이를 달성하기 위해 Python의 Pandas 라이브러리에 내장된 함수를 활용할 수 있습니다.
한 가지 접근 방식은 A 열을 기준으로 데이터 프레임을 정렬한 다음 중복 항목을 삭제하는 것입니다. 마지막 발생을 유지하면서. 이는 다음과 같이 표현됩니다.
df.sort_values(by='A').drop_duplicates(subset='A', keep='last')
또는 다음과 같은 보다 유연한 솔루션을 사용할 수 있습니다. 다른 기준을 고려하면 데이터 프레임을 A 열로 그룹화하는 것입니다. 각 그룹 내에서 B 열의 최대 값을 갖는 행을 추출할 수 있습니다. 이는 다음 코드를 사용하여 달성할 수 있습니다:
df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])
By 이러한 방법 중 하나를 구현하면 B 값이 가장 높은 행이 보존되도록 하면서 A 열의 중복 값을 효과적으로 제거할 수 있습니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3