"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Pandas GroupBy.apply가 첫 번째 행을 복제하는 것처럼 보이는 이유는 무엇입니까?

Pandas GroupBy.apply가 첫 번째 행을 복제하는 것처럼 보이는 이유는 무엇입니까?

2024-11-09에 게시됨
검색:987

Why Does Pandas GroupBy.apply Seem to Duplicate the First Row?

Pandas GroupBy.apply가 첫 번째 그룹을 중복함: 동작 이해

Pandas에서 groupby 기능을 사용할 때 적용 메서드가 첫 번째 그룹에 두 번 함수를 적용하는 것처럼 보일 수 있습니다. 데이터 프레임의 행. 이 동작은 예상치 못한 것처럼 보이지만 의도적으로 설계된 것입니다.

이중 응용 프로그램의 목적

적용 함수는 결합할 데이터의 모양을 결정해야 합니다. 이를 달성하기 위해 지정된 함수(이 경우 checkit)를 두 번 호출합니다. 첫 번째 호출은 출력의 모양을 추론하는 데 도움이 되고 두 번째 호출은 그룹에 대한 작업을 실행합니다.

이중 효과 방지

사용 사례에 따라 대안을 사용하여 이중 적용을 피할 수 있습니다. 함수:

  • aggregate: 반환 값이 평균 또는 평균과 같은 요약 통계여야 합니다. sum.
  • transform: 반환 값이 입력 그룹과 동일한 모양을 가져야 합니다.
  • filter: 반환 값이 다음과 같아야 합니다. 유지할 행을 나타내는 부울 인덱스.

이 함수는 반환 값에 특정 모양을 적용하여 이중 형식이 필요하지 않습니다. 응용 프로그램.

부작용 고려 사항

적용하는 함수에 부작용이 없는 경우, 즉 원래 데이터 프레임을 수정하지 않는 경우 이중 응용 프로그램은 중요하지 않을 가능성이 높습니다. 그러나 함수가 데이터 조작을 수행하는 경우 첫 번째 행에 이중 적용이 의도하지 않은 결과를 초래할 수 있습니다.

최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3