で列をビニングすることができますが、その表現と分析を簡素化するためにデータをカテゴリにビンすることがしばしば役立ちます。これは、以下に示すように、
[パーセント]を含む「パーセンテージ」という名前のデータフレーム列があると仮定します。 ['パーセンテージ']。head() 46.5 44.2 100.0 42.12はこの列を作成し、各ビンの値カウントを取得するには、pd.cut関数を使用できます。これを達成するための2つの方法は次のとおりです。
df['percentage'].head() 46.5 44.2 100.0 42.12pd.cutを使用してvalue_counts:
bins = [0、1、5、10、25、50、100] df ['binned'] = pd.cut(df ['パーセンテージ']、ビン) print(df.groupby(df ['Binned']) np.searchsorted(bins、df ['パーセンテージ']。値) print(df.groupby(df ['binned'])。size()) 両方の方法は、次の出力を返します:
bins = [0, 1, 5, 10, 25, 50, 100] df['binned'] = pd.cut(df['percentage'], bins) print(df.groupby(df['binned']).size())
この出力は、ビンに値がないことを示しています(0、1]、(1、5]、(5、10]、および(10、25]。ビン(25、50]、および1つの値がビンに落ちます(50、100]。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3