Pandas DataFrame GroupBy 값 계산을 위한 여러 열
Pandas를 사용한 DataFrame 조작에서 데이터를 여러 열로 그룹화하면 귀중한 통찰력을 얻을 수 있습니다. 이 문서에서는 두 개의 열로 그룹화하면서 관측치를 계산하는 방법과 각 그룹화의 최고 개수를 결정하는 방법을 보여줍니다.
여러 열이 있는 DataFrame이 있으면 'groupby' 함수를 데이터 그룹화에 적용할 수 있습니다. 특정 열을 기반으로 합니다. 여기에는 'col1', 'col2', 'col3', 'col4' 및 'col5'의 5개 열이 있는 'df'라는 DataFrame이 있습니다.
import pandas as pd
df = pd.DataFrame([
[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3],
list('AAABBBBABCBDDD'),
[1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8],
['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],
['1','3','3','2','4','2','5','3','6','3','5','1','1','1']
]).T
df.columns = ['col1','col2','col3','col4','col5']
행 그룹별로 계산
각 행 그룹의 관측치 수를 확인하려면 원하는 열에 'groupby' 함수를 사용한 다음 'size' 함수를 적용하세요.
result = df.groupby(['col5', 'col2']).size()
이것은 그룹화된 열을 인덱스로, 크기를 값으로 사용하여 DataFrame을 생성합니다.
print(result)
가장 높은 개수 결정
각 'col2' 값의 최대 개수를 결정하려면 'col2'에 'groupby' 함수를 사용한 후 그룹화된 데이터에 'max' 함수를 적용합니다. .
result = df.groupby(['col5', 'col2']).size().groupby(level=1).max()
이것은 다음을 생성합니다. 각 'col2' 값에 대한 최대 개수가 있는 시리즈입니다.
print(result)
요약하면 Pandas에서 'groupby' 및 'size' 기능을 사용하면 효율적인 작업이 가능합니다. 데이터를 분석하고 집계하여 사용자가 다양한 방법으로 데이터에 대한 통찰력을 추출할 수 있도록 합니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3