"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > B열에서 가장 높은 값을 가진 행을 유지하면서 A열의 중복 항목을 제거하는 방법은 무엇입니까?

B열에서 가장 높은 값을 가진 행을 유지하면서 A열의 중복 항목을 제거하는 방법은 무엇입니까?

2024년 11월 11일에 게시됨
검색:589

How to Remove Duplicates in Column A While Keeping the Row with the Highest Value in Column B?

열 A에서 중복 항목을 제거할 때 가장 높은 B 값을 갖는 행 유지

현재 작업에는 열 A의 중복 값을 제거하는 작업이 포함됩니다. B 열에서 가장 높은 값을 가진 행을 유지하면서 데이터 프레임을 만듭니다. 이를 달성하기 위해 Python의 Pandas 라이브러리에 내장된 함수를 활용할 수 있습니다.

한 가지 접근 방식은 A 열을 기준으로 데이터 프레임을 정렬한 다음 중복 항목을 삭제하는 것입니다. 마지막 발생을 유지하면서. 이는 다음과 같이 표현됩니다.

df.sort_values(by='A').drop_duplicates(subset='A', keep='last')

또는 다음과 같은 보다 유연한 솔루션을 사용할 수 있습니다. 다른 기준을 고려하면 데이터 프레임을 A 열로 그룹화하는 것입니다. 각 그룹 내에서 B 열의 최대 값을 갖는 행을 추출할 수 있습니다. 이는 다음 코드를 사용하여 달성할 수 있습니다:

df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])

By 이러한 방법 중 하나를 구현하면 B 값이 가장 높은 행이 보존되도록 하면서 A 열의 중복 값을 효과적으로 제거할 수 있습니다.

최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3