Pandas でグループ化されたデータフレームにグループ数を含む列を追加する方法

表紙 > プログラミング > Pandas でグループ化されたデータフレームにグループ数を含む列を追加する方法

Pandas でグループ化されたデータフレームにグループ数を含む列を追加する方法

2024 年 11 月 6 日に公開

ブラウズ：892

How to Add a Column with Group Counts to a Grouped Dataframe in Pandas?

Pandas でグループ化されたデータフレームに列を追加する方法

データ分析では、多くの場合、データをグループ化し、計算を実行する必要があります。各グループ。 Pandas は、groupby 関数を通じてこれを行う便利な方法を提供します。一般的なタスクの 1 つは、各グループ内の列の値をカウントし、これらのカウントを含む列をデータフレームに追加することです。

データフレーム df:

df = pd.DataFrame({'c':[1,1,1,2,2,2,2],'type':['m','n','o','m','m','n','n']})

各 c の type の値をカウントするには、グループ化されたデータフレームで value_counts 関数を使用できます。

g = df.groupby('c')['type'].value_counts().reset_index(name='t')

これにより、グループ数を含む新しいデータフレーム g が作成されます。各グループのサイズを示す列を g に追加するには、変換関数:

g['size'] = df.groupby('c')['type'].transform('size')

transform は、元のデータフレームの各グループに関数を適用し、元のデータフレームに合わせたインデックスを持つ Series を返します。この場合、size 関数を使用して各グループ内の要素の数をカウントし、それを新しい列サイズに割り当てます。結果のデータフレーム g は次のようになります:

   c type  t  size
0  1    m  1     3
1  1    n  1     3
2  1    o  1     3
3  2    m  2     4
4  2    n  2     4

これは、groupby 集計の結果に基づいて、グループ化されたデータフレームに新しい列を追加する簡単な方法を示しています。

リリースステートメントこの記事は次の場所に転載されています: 1729308796 権利侵害がある場合は、[email protected] に連絡して削除してください。

最新のチュートリアルもっと>

Pythonの理解を使用して辞書を効率的に作成するにはどうすればよいですか？
python辞書の理解 Pythonでは、辞書の概念は新しい辞書を生成するための簡潔な方法を提供します。それらはリストの概念に似ていますが、いくつかの顕著な違いがあります。キーと値を明示的に指定する必要があります。たとえば、 d = {n：n ** 2の範囲（5）} これは、0から4の...

プログラミング 2025-04-18に投稿されました
マウスクリック時にDiv内のすべてのテキストをプログラム的に選択するにはどうすればよいですか？
マウスクリックでプログラムをプログラム的に選択する質問テキストコンテンツのdiv要素が与えられた場合、ユーザーは1つのマウスクリックでdiv内のテキスト全体をプログラム的に選択できますか？これにより、ユーザーは選択したテキストを簡単にドラッグアンドドロップしたり、直接コピーしたりできます。...

プログラミング 2025-04-18に投稿されました
Go Webアプリケーションはいつデータベース接続を閉じますか？
Go Webアプリケーションのデータベース接続の管理 PostgreSQLなどのデータベースを使用する単純なGO Webアプリケーションで、データベース接続の閉鎖のタイミングが考慮されます。これは、無期限に実行されるアプリケーションでこれをいつ、どのように処理するかを深く掘り下げます。 f...

プログラミング 2025-04-18に投稿されました
HTMLがページ番号やソリューションを印刷できない理由
はhtmlページにページ番号を印刷できません。使用： @page { マージン：10％; @トップセンター{ フォントファミリー：sans-serif; font-weight：bold; font-size：2em; コンテンツ：カウンター（ページ）...

プログラミング 2025-04-18に投稿されました
Python読み取りCSVファイルUnicodedeCodeError究極のソリューション
unicode decodeエラーがcsvファイルreading 内蔵csvモジュールを使用してpythonにcsvファイルを読み込もうとする場合、エラーが発生する可能性があります： SyntaxError: (unicode error) 'unicodeescape' codec ...

プログラミング 2025-04-18に投稿されました
順序付けられていないコレクションにタプルの一般的なハッシュ関数を実装する方法は？
std :: unordered_mapとunordered_setコンテナは、ハスド値に基づいて効率的なルックアップと元素の挿入を提供します。ただし、カスタムハッシュ関数を定義せずにこれらのコレクションのキーとしてタプルを使用すると、予期しない動作につながる可能性があります。 st...

プログラミング 2025-04-18に投稿されました
Pythonで変動値を検出するために「if」の代わりに「試行」を使用するのはいつですか？
を使用して、「try」vs. "を使用して、python で変数値をテストするために、変数が処理前に値を持っているかどうかを確認する必要がある状況があります。このジレンマは、「if」または「try」コンストラクトを使用するかどうかを決定するときに発生します。あなたの例では、「if」...

プログラミング 2025-04-18に投稿されました
PDOパラメーターを使用してクエリのように正しく使用する方法は？
を使用してpdo PDOで同様のクエリを実装しようとすると、以下のクエリのような問題に遭遇する可能性があります： $query = "SELECT * FROM tbl WHERE address LIKE '%?%' OR address LIKE '%?%'";...

プログラミング 2025-04-18に投稿されました
decimal.parse（）を使用して指数表記で数値を解析する方法は？
指数表記からの数字を解析する場合、decimal.parse（ "1.2345e-02"）を使用して指数表記で表現された文字列を解析しようとすると、エラーが発生します。これは、デフォルトの解析方法が指数表記法を認識しないためです。次の例に示すように、numberSty...

プログラミング 2025-04-18に投稿されました
$\ "while（1）vs。for（;;）：コンパイラの最適化はパフォーマンスの違いを排除しますか？\"$
\ "while（1）vs。for（;;）：コンパイラの最適化はパフォーマンスの違いを排除しますか？\"
while（1）vs。for（;;）：速度の違いはありますか？ loops？回答：では、ほとんどの最新のコンパイラでは、（1）と（;;）。コンパイラー： perl：の両方が（1）と（;;）が同じオプコードをもたらします。 1 入力 - > 2を入力します 2 NextSt...

プログラミング 2025-04-18に投稿されました
Microsoft Visual C ++が2フェーズテンプレートのインスタンス化を正しく実装できないのはなぜですか？
Microsoft Visual Cの「壊れた」2フェーズテンプレートのインスタンス化の謎問題声明：ユーザーは、Microsoft Visual C（MSVC）の懸念を表現する一般的な懸念を表明します。メカニズムの特定の側面は、予想どおりに動作できませんか？ただし、このチェックがテンプ...

プログラミング 2025-04-18に投稿されました
MySQLの2つの条件に基づいて行を効率的に挿入または更新する方法は？
2つの条件で挿入または更新する問題説明：既存の行一致が見つかった場合。この強力な機能により、一致する行が存在しない場合、または一意のキー制約が違反している場合は既存の行を更新する場合、新しい行を挿入することにより、効率的なデータ操作が可能になります。このキーは、テーブル内の一...

プログラミング 2025-04-18に投稿されました
なぜsqlalchemyフィルター条項で「flake8」はブールの比較にフラグを立てるのですか？
flake8 Flake8 Flake8フラグをフィルター節のブール比較 SQLのブール比較に基づいてクエリ結果をフィルタリングしようとすると、開発者は「==」の使用に関してFLAKE8から警告を発する可能性があります。一般に、「condがfalse」または「condではない場合：」を...

プログラミング 2025-04-18に投稿されました
入力：なぜ「警告：mysqli_query（）がパラメーター1がmysqliであると予想し、リソースが与えられた「エラーが発生し、それを修正する方法」出力：エラーを解決するための分析と修正「警告：mysqli_query（）パラメーターは、リソースの代わりにmysqliである必要があります」
mysqli_query（）は、パラメーター1がmysqliであることを期待しています。発生する可能性があります。このエラーは、最初のパラメーターのタイプと予想されるリソースタイプとの間の不一致を示します。これらの2つの拡張機能は交換可能ではなく、一緒に使用することはできません。 MySQ...

プログラミング 2025-04-18に投稿されました
McRyptからOpenSSLに暗号化を移行し、OpenSSLを使用してMcRyptで暗号化されたデータを復号化できますか？
暗号化ライブラリをMcRyptからOpenSSL にアップグレードして、暗号化ライブラリをMcRyptからOpenSLにアップグレードできますか？ OpenSSLでは、McRyptで暗号化されたデータを復号化することは可能ですか？ 2つの異なる投稿は矛盾する情報を提供します。もしそうなら...

プログラミング 2025-04-18に投稿されました