"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Pandas DataFrame GroupBy를 사용하여 값 계산을 수행하고 여러 열의 최대 개수를 찾는 방법은 무엇입니까?

Pandas DataFrame GroupBy를 사용하여 값 계산을 수행하고 여러 열의 최대 개수를 찾는 방법은 무엇입니까?

2024년 11월 11일에 게시됨
검색:806

How to Perform Value Counts and Find Maximum Counts for Multiple Columns Using Pandas DataFrame GroupBy?

Pandas DataFrame GroupBy 값 계산을 위한 여러 열

Pandas를 사용한 DataFrame 조작에서 데이터를 여러 열로 그룹화하면 귀중한 통찰력을 얻을 수 있습니다. 이 문서에서는 두 개의 열로 그룹화하면서 관측치를 계산하는 방법과 각 그룹화의 최고 개수를 결정하는 방법을 보여줍니다.

여러 열이 있는 DataFrame이 있으면 'groupby' 함수를 데이터 그룹화에 적용할 수 있습니다. 특정 열을 기반으로 합니다. 여기에는 'col1', 'col2', 'col3', 'col4' 및 'col5'의 5개 열이 있는 'df'라는 DataFrame이 있습니다.

import pandas as pd

df = pd.DataFrame([
    [1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], 
    list('AAABBBBABCBDDD'), 
    [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], 
    ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],
    ['1','3','3','2','4','2','5','3','6','3','5','1','1','1']
]).T
df.columns = ['col1','col2','col3','col4','col5']

행 그룹별로 계산

각 행 그룹의 관측치 수를 확인하려면 원하는 열에 'groupby' 함수를 사용한 다음 'size' 함수를 적용하세요.

result = df.groupby(['col5', 'col2']).size()

이것은 그룹화된 열을 인덱스로, 크기를 값으로 사용하여 DataFrame을 생성합니다.

print(result)

가장 높은 개수 결정

각 'col2' 값의 최대 개수를 결정하려면 'col2'에 'groupby' 함수를 사용한 후 그룹화된 데이터에 'max' 함수를 적용합니다. .

result = df.groupby(['col5', 'col2']).size().groupby(level=1).max()

이것은 다음을 생성합니다. 각 'col2' 값에 대한 최대 개수가 있는 시리즈입니다.

print(result)

요약하면 Pandas에서 'groupby' 및 'size' 기능을 사용하면 효율적인 작업이 가능합니다. 데이터를 분석하고 집계하여 사용자가 다양한 방법으로 데이터에 대한 통찰력을 추출할 수 있도록 합니다.

릴리스 선언문 이 글은 1729650500에서 재인쇄되었습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3