Pandas Transform を使用して GroupBy データフレームに列を追加する
パンダで groupby 操作を操作する場合、新しい列を結果のデータフレーム。これを実現する 1 つの方法は、例で示すように .map() 関数を使用することです。ただし、代わりのより簡単なアプローチは、.transform() 関数を使用することです。
.transform() を使用すると、データフレーム内の各グループに関数を適用し、結果を含むシリーズを返すことができます。返された Series には、元のデータフレームと一致するインデックスが付けられます。
例として、提供されたデータフレームから始めましょう:
df = pd.DataFrame({'c': [1, 1, 1, 2, 2, 2, 2], 'type': ['m', 'n', 'o', 'm', 'm', 'n', 'n']})
私たちの目標は、各 c の type の値をカウントし、c.
g = df.groupby('c')['type'].value_counts().reset_index(name='t')
このコードは、各グループの値をカウントし、t という名前の新しい列を作成します。
.transform() を使用してサイズ列を追加するには、次のようにします。次の操作を実行します:
g['size'] = df.groupby('c')['type'].transform('size')
.transform('size')サイズ関数を各グループに適用し、各グループのサイズを返します。結果として得られる Series は元のデータフレームのインデックスと一致するため、新しい列として g.
に追加できます。出力は、size:
c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4
.transform() を使用すると、groupby 集計から元のデータフレームに列を追加し戻す、より簡潔で簡単な方法が提供されます。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3