Pandas DataFrame 文字列エントリを別々の行に分解 (分割) する方法は?

表紙 > プログラミング > Pandas DataFrame 文字列エントリを別々の行に分解 (分割) する方法は?

Pandas DataFrame 文字列エントリを別々の行に分解 (分割) する方法は?

2024 年 12 月 25 日に公開

ブラウズ：788

How to Explode (Split) Pandas DataFrame String Entries into Separate Rows?

Pandas DataFrame 文字列エントリを個別の行に分解 (分割)

Pandas では、一般的な要件は、カンマ区切りの値を 1 つの行に分割することです。テキスト文字列列を作成し、エントリごとに新しい行を作成します。これは、さまざまな方法で実現できます。

Series.explode() または DataFrame.explode() を使用する

Pandas バージョン 0.25.0 以降の場合は、Series。 explode() メソッドと DataFrame.explode() メソッドは、CSV のように展開する便利な方法を提供します。列:

単一列の場合:

df.explode('column_name')

複数列の場合:

df.explode(['column1', 'column2'])  # Pandas 1.3.0

汎用ベクトル化関数

通常の列とリスト列の両方で機能する、より汎用性の高いベクトル化アプローチを以下に示します。

def explode(df, lst_cols, fill_value='', preserve_index=False):
    # Convert CSV string columns to list columns
    for col in lst_cols:
        df[col] = df[col].str.split(',')

    # Extract all non-list columns
    idx_cols = df.columns.difference(lst_cols)

    # Calculate list lengths
    lens = df[lst_cols[0]].str.len()

    # Create exploded DataFrame
    result = (pd.DataFrame({
        col: np.repeat(df[col].values, lens)
        for col in idx_cols
    }, index=np.repeat(df.index.values, lens))
        .assign(**{col: np.concatenate(df.loc[lens>0, col].values)
                    for col in lst_cols}))

    # Handle empty list rows
    if (lens == 0).any():
        result = result.append(df.loc[lens==0, idx_cols], sort=False).fillna(fill_value)

    # Revert index order and reset index if requested
    result = result.sort_index()
    if not preserve_index:
        result = result.reset_index(drop=True)

    return result

アプリケーション

CSV列:

df['var1'] = df['var1'].str.split(',')

複数のリスト列:

explode(df, ['num', 'text'], fill_value='')

最新のチュートリアルもっと>

Pythonで動的変数を作成する方法は？
python の動的変数作成は、特に複雑なデータ構造またはアルゴリズムを操作する場合、動的に変数を作成する能力が強力なツールになります。 Pythonは、これを達成するためのいくつかの創造的な方法を提供します。辞書を使用すると、キーを動的に作成し、対応する値を割り当てることができます。...

プログラミング 2025-04-17に投稿されました
オブジェクトフィット：IEとEdgeでカバーが失敗します、修正方法は？
object-fit：カバーがIEとEDGEで失敗します。 CSSでは、一貫した画像の高さを維持するために、ブラウザ全体でシームレスに動作します。ただし、IEとEdgeでは、独特の問題が発生します。ブラウザをスケーリングすると、画像は高さをズームするのではなく幅でサイズを変更し、外観を歪め...

プログラミング 2025-04-17に投稿されました
データ挿入時の「一般エラー: 2006 MySQL サーバーが消えました」を修正するにはどうすればよいですか?
レコードの挿入中に「一般エラー: 2006 MySQL サーバーが消えました」を解決する方法はじめに:MySQL データベースにデータを挿入すると、「一般エラー: 2006 MySQL サーバーが消えました。」というエラーが発生することがあります。このエラーは、通常、MySQL 構成内の 2 つの変...

プログラミング 2025-04-17に投稿されました
java.net.urlconnectionとmultipart/form-dataエンコードを使用して追加のパラメーターを使用してファイルをアップロードする方法は？
http requests を使用してファイルをhttpサーバーにアップロードしながら、追加のパラメーター、java.net.urlconnection、およびmultipart/dataエンコーディングを送信します。プロセスの内訳は次のとおりです。エンコーディングには、要求本体を複数...

プログラミング 2025-04-17に投稿されました
McRyptからOpenSSLに暗号化を移行し、OpenSSLを使用してMcRyptで暗号化されたデータを復号化できますか？
暗号化ライブラリをMcRyptからOpenSSL にアップグレードして、暗号化ライブラリをMcRyptからOpenSLにアップグレードできますか？ OpenSSLでは、McRyptで暗号化されたデータを復号化することは可能ですか？ 2つの異なる投稿は矛盾する情報を提供します。もしそうなら...

プログラミング 2025-04-17に投稿されました
JavaScriptオブジェクトにキーを動的に設定する方法は？
JavaScriptオブジェクト変数の動的キーを作成する方法この構文jsObj['key' i] = 'example' 1; はjavascriptで、アレイは特殊なタイプのオブジェクトです。この特別な動作は標準のオブジェクトによって模倣されていませんが、四角いブラケット演算子は...

プログラミング 2025-04-17に投稿されました
Javaのフルスクリーン専用モードでユーザー入力を処理する方法は？
ハンドリングユーザー入力は、java intuling in full screenの排他的モードでのフルスクリーンの排他的モードでのハンドリングを排他的モードで実行するとき、通常のイベント処理メカニズムは予想されるように機能しない場合があります。この記事では、このモードでキーボード...

プログラミング 2025-04-17に投稿されました
PHPとC ++関数の過負荷処理の違い
PHP関数の過負荷：cの観点から謎を解き明かす PHPの領域に挑戦する経験豊富なC開発者として、関数過負荷の概念に遭遇するかもしれません。この概念は、Cではありふれたものですが、PHPでユニークな課題を提起しています。 PHP関数の過負荷の複雑さを掘り下げて、それが提供する可能性を掘り下げ...

プログラミング 2025-04-17に投稿されました
Microsoft Visual C ++が2フェーズテンプレートのインスタンス化を正しく実装できないのはなぜですか？
Microsoft Visual Cの「壊れた」2フェーズテンプレートのインスタンス化の謎問題声明：ユーザーは、Microsoft Visual C（MSVC）の懸念を表現する一般的な懸念を表明します。メカニズムの特定の側面は、予想どおりに動作できませんか？ただし、このチェックがテンプ...

プログラミング 2025-04-17に投稿されました
純粋なCSSでは、複数の粘着性要素を互いに積み重ねることができますか？
純粋なCSSで複数の粘着性要素を互いに積み重ねることは可能ですか？ここ： https://webthemez.com/demo/sticky-multi-header-scroll/index.html JavaScriptの実装ではなく、純粋なCSSを使用することのみです。複数の粘...

プログラミング 2025-04-17に投稿されました
PHPのUnicode文字列からURLに優しいナメクジを効率的に生成するにはどうすればよいですか？
効率的なナメクジ生成のための関数を作成するスラッグの作成、URLで使用されるユニコード文字列の単純化された表現は挑戦的な作業になります。この記事では、スラッグを効率的に生成し、特殊文字と非ASCII文字をURLに優しい形式に変換するための簡潔なソリューションを紹介します。一連の操作を使用...

プログラミング 2025-04-17に投稿されました
$解決する方法\「スクリプト... \ "Androidのコンテンツセキュリティポリシーによるエラーのロードを拒否しましたか？$
解決する方法\「スクリプト... \ "Androidのコンテンツセキュリティポリシーによるエラーのロードを拒否しましたか？
ミステリーを発表する：コンテンツセキュリティポリシー指示エラー謎めいたエラーに遭遇する「スクリプトのロードを拒否する...」Androidアプリを展開するときに？この問題は、信頼されていないソースからのリソースの負荷を制限するコンテンツセキュリティポリシー（CSP）指令に由来しています。...

プログラミング 2025-04-17に投稿されました
JavaのMap.EntryとSimpleEntryはどのようにキー価値ペア管理を単純化しますか？
valueペアの包括的なコレクション：javaのmap.entry and simpleEntry をJavaで紹介します。 However, for scenarios where maintaining the order of elements is crucial and un...

プログラミング 2025-04-17に投稿されました
右のテーブルの句でフィルタリングするときに、なぜ左結合が接続内のように見えるのですか？
left join conundrum：witching時間：データベースウィザードの領域で内側の結合に変わる時間は、左結合を使用して複雑なデータ検索を実行することは一般的な慣行です。ただし、時々、左の結合が予想通りに動作しないことがあります。 A.foo、 B.BAR、 C.Foobar...

プログラミング 2025-04-17に投稿されました
テキストからHTMLタグを削除するPython効率的な方法
htmlタグをpythonで削除するために、html応答を操作することがよくあると、html応答を操作することがしばしば抽出され、形式のタグを排除します。これは、HTMLタグを効果的に剥がし、目的のプレーンテキストを残すことで実現できます。 mlstripperはHTML入力を取り、それを...

プログラミング 2025-04-17に投稿されました