「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > パンダの列を効率的にビンし、各ビンの値をカウントする方法は?

パンダの列を効率的にビンし、各ビンの値をカウントする方法は?

2025-02-06に投稿しました
ブラウズ:440

How to Efficiently Bin a Pandas Column and Count Values in Each Bin?

は、データ分析でパンダ

で列をビニングすることができますが、その表現と分析を簡素化するためにデータをカテゴリにビンすることがしばしば役立ちます。これは、以下に示すように、

[パーセント]を含む「パーセンテージ」という名前のデータフレーム列があると仮定します。 ['パーセンテージ']。head() 46.5 44.2 100.0 42.12

はこの列を作成し、各ビンの値カウントを取得するには、pd.cut関数を使用できます。これを達成するための2つの方法は次のとおりです。
df['percentage'].head()
46.5
44.2
100.0
42.12
pd.cutを使用してvalue_counts:

bins = [0、1、5、10、25、50、100] df ['binned'] = pd.cut(df ['パーセンテージ']、ビン) print(df.groupby(df ['Binned']) np.searchsorted(bins、df ['パーセンテージ']。値) print(df.groupby(df ['binned'])。size()) 両方の方法は、次の出力を返します:

bins = [0, 1, 5, 10, 25, 50, 100]
df['binned'] = pd.cut(df['percentage'], bins)
print(df.groupby(df['binned']).size())

この出力は、ビンに値がないことを示しています(0、1]、(1、5]、(5、10]、および(10、25]。ビン(25、50]、および1つの値がビンに落ちます(50、100]。

最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3