「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > パンダのデータフレームに新しい列を効率的に追加するにはどうすればよいですか?

パンダのデータフレームに新しい列を効率的に追加するにはどうすればよいですか?

2025-03-04に投稿されました
ブラウズ:626

How Can I Efficiently Add a New Column to a Pandas DataFrame?

既存のデータフレームに新しい列を追加する

Pandas DataFramesを使用すると、既存のデータフレームに新しい列を追加する必要があることがよくあります。これを達成するための複数のアプローチがあり、それぞれに独自の利点と欠点があります。 assign(Pandas 0.17以降に推奨):

をPDとしてインポートする npとしてnumpyをインポートします #サンプルデータフレームを生成します df1 = pd.dataframe({ 'A':[0.671399、0.446172、0.614758]、 'B':[0.101208、-0.243316、0.075793]、 'C':[-0.181532、0.051767、-0.451460]、 「D」:[0.241273、1.577318、-0.012493] }) #ランダムな値で新しい列「E」を追加します slength = len(df1 ['a']) df1 = df1.assign(e = pd.series(np.random.randn(slength))。値)

import pandas as pd
import numpy as np

# Generate a sample DataFrame
df1 = pd.DataFrame({
    'a': [0.671399, 0.446172, 0.614758],
    'b': [0.101208, -0.243316, 0.075793],
    'c': [-0.181532, 0.051767, -0.451460],
    'd': [0.241273, 1.577318, -0.012493]
})

# Add a new column 'e' with random values
sLength = len(df1['a'])
df1 = df1.assign(e=pd.Series(np.random.randn(sLength)).values)

#locを使用して新しい列 'f'を追加する df1.loc [: 'f'] = pd.series(np.random.randn(slength)、index = df1.index)

# Add a new column 'f' using loc
df1.loc[:, 'f'] = pd.Series(np.random.randn(sLength), index=df1.index)

#古い方法を使用して新しい列 'g'を追加する df1 ['g'] = pd.series(np.random.randn(slength)、index = df1.index)

後者の方法は、パンダの新しいバージョンでの設定をトリガーする可能性があることを忘れないでください。割り当てまたはlocの使用は、効率と明確さのために一般的に推奨されます。
            
最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3