"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > 팬더 칼럼을 효율적으로 쓰고 각 빈에서 값을 계산하는 방법은 무엇입니까?

팬더 칼럼을 효율적으로 쓰고 각 빈에서 값을 계산하는 방법은 무엇입니까?

2025-02-06에 게시되었습니다
검색:183

How to Efficiently Bin a Pandas Column and Count Values in Each Bin?

팬더와 함께 열을 binning

df['percentage'].head()
46.5
44.2
100.0
42.12

아래와 같이 숫자 값을 포함하는 "백분율"이라는 데이터 프레임 열이 있다고 가정합니다.

df . head () 46.5 44.2 100.0 42.12

이 열을 쓰러 뜨리고 각 빈에 대한 값 수를 얻으려면 pd.cut 함수를 사용할 수 있습니다. 다음은 다음과 같은 두 가지 방법입니다. df
bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)
print(df.groupby(df['binned']).size())
, bins) print (df.groupby (df

). size ())

np.searchsorted 및 groupby를 사용하여 :
df['binned'] = np.searchsorted(bins, df['percentage'].values)
print(df.groupby(df['binned']).size())
df

= np.searchSorted (bins, df

. 값) print (df.groupby (df
percentage
(0, 1]       0
(1, 5]       0
(5, 10]      0
(10, 25]     0
(25, 50]     3
(50, 100]    1
dtype: int64

두 가지 메소드는 다음 출력을 반환합니다 :

백분율 (0, 1] 0 (1, 5] 0 (5, 10] 0 (10, 25] 0 (25, 50] 3 (50, 100] 1 dtype : int64 How to Efficiently Bin a Pandas Column and Count Values in Each Bin?

이 출력은 빈 (0, 1], (1, 5], (5, 10] 및 (10, 25]에 값이 없음을 나타냅니다. 세 값은 빈 (25, 50], 1 개의 값은 빈 (50, 100]에 있습니다.

최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3