在 Python pandas 中處理稀疏資料時,將清單插入特定單元格中可能具有挑戰性。使用 df.ix[1,'B'] = abc 等常見方法嘗試此類操作通常會因密鑰長度不匹配而導致錯誤。
嘗試解決將列表括在附加方括號中(例如df.ix[1,'B'] = [abc])或使用字串表示形式(例如df.ix[1,'B'] = ', '.join (abc)) 並不令人滿意,因為它們引入了額外的元素或改變了預期的資料結構。
更有效的方法是使用 df.at 而不是df.ix 或 df.loc。 df.at 專門針對單一單元格,消除了可能導致上述錯誤的歧義。
import pandas as pd
# Create a dataframe with mixed data types
df = pd.DataFrame(data={'A': [1, 2, 3], 'B': ['x', 'y', 'z']})
# Insert a list into cell 1B
df.at[1, 'B'] = ['m', 'n']
print(df)
此操作成功將['m', 'n']插入單元格1B,沒有任何錯誤。
需要注意的是您打算插入清單的列必須將其 dtype 設為「object」。如果列具有不同的資料類型,例如“int64”,則會發生錯誤。為了解決這個問題,您可以在嘗試插入之前轉換列的資料型別:
df = pd.DataFrame(data={'A': [1, 2, 3], 'B': [1,2,3]})
df['B'] = df['B'].astype('object')
# Now, list insertion will work as expected
df.at[1, 'B'] = [1, 2, 3]
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3