"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Pandas의 그룹화된 데이터 프레임에 그룹 개수가 포함된 열을 추가하는 방법은 무엇입니까?

Pandas의 그룹화된 데이터 프레임에 그룹 개수가 포함된 열을 추가하는 방법은 무엇입니까?

2024-11-06에 게시됨
검색:327

How to Add a Column with Group Counts to a Grouped Dataframe in Pandas?

Pandas에서 그룹화된 데이터프레임에 열을 추가하는 방법

데이터 분석에서는 데이터를 그룹화하고 계산을 수행해야 하는 경우가 많습니다. 각 그룹. Pandas는 그룹별 기능을 통해 이를 수행하는 편리한 방법을 제공합니다. 일반적인 작업 중 하나는 각 그룹 내의 열 값을 계산하고 이러한 개수를 포함하는 열을 데이터 프레임에 추가하는 것입니다.

데이터 프레임 df를 고려하세요:

df = pd.DataFrame({'c':[1,1,1,2,2,2,2],'type':['m','n','o','m','m','n','n']})

각 c에 대한 유형 값을 계산하려면 그룹화된 데이터 프레임에서 value_counts 함수를 사용할 수 있습니다.

g = df.groupby('c')['type'].value_counts().reset_index(name='t')

이것은 그룹 개수를 사용하여 새 데이터프레임 g를 생성합니다. 각 그룹의 크기와 함께 g에 열을 추가하려면 변환 함수:

g['size'] = df.groupby('c')['type'].transform('size')

transform은 원본 데이터 프레임의 각 그룹에 함수를 적용하고 해당 인덱스가 원본 데이터 프레임에 정렬된 시리즈를 반환합니다. 이 경우 크기 함수를 사용하여 각 그룹의 요소 수를 계산하고 이를 새 열 크기에 할당합니다. 결과 데이터프레임 g는 이제 다음과 같습니다:

   c type  t  size
0  1    m  1     3
1  1    n  1     3
2  1    o  1     3
3  2    m  2     4
4  2    n  2     4

이는 그룹별 집계 결과를 기반으로 그룹화된 데이터 프레임에 새 열을 추가하는 간단한 방법을 보여줍니다.

릴리스 선언문 이 글은 1729308796에서 재인쇄되었습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3