"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > 팬더의 특정 열에서 중복 행을 효율적으로 제거하려면 어떻게해야합니까?

팬더의 특정 열에서 중복 행을 효율적으로 제거하려면 어떻게해야합니까?

2025-03-23에 게시되었습니다
검색:969

How Can I Efficiently Remove Duplicate Rows Across Specific Columns in Pandas?

예를 들어 다음 데이터 프레임을 고려하십시오 :

a b c. 0 foo 0 a 1 foo 1 a 2 foo 1 b 3 bar 1 a

열에서 'a'및 'C'에서 동일한 값이있는 행을 제거하고 싶다고 가정 해 봅시다. 이 경우 행 0과 1이 제거됩니다.

이전 에이 작업에는 수동 필터링 또는 복잡한 작업이 필요했습니다. 그러나 Pandas의 Enhanced Drop_Duplicates 기능을 사용하면 이제 산들 바람입니다. keep 매개 변수의 소개를 사용하면 복제 방법을 처리하는 방법을 제어 할 수 있습니다.

특정 열에서 일치하는 행을 떨어 뜨려 서브 세트 매개 변수를 사용하십시오. False를 유지하면 팬더에게 모든 중복 행을 제거하도록 지시합니다. df = pd.dataframe ({ "a":
    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A
, repo = false)

출력 :

a b c 2 foo 1 b 3 bar 1 a

보시다시피, 행 0과 1은 성공적으로 제거되며 열의 a '및'c. '의 값을 기반으로 고유 한 행만 남겨 둡니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3