在 Python pandas 中处理稀疏数据时,将列表插入到特定单元格中可能具有挑战性。使用 df.ix[1,'B'] = abc 等常见方法尝试此类操作通常会因密钥长度不匹配而导致错误。
尝试解决将列表括在附加方括号中(例如 df.ix[1,'B'] = [abc])或使用字符串表示形式(例如 df.ix[1,'B'] = ', '.join (abc)) 并不令人满意,因为它们引入了额外的元素或改变了预期的数据结构。
更有效的方法是使用 df.at 而不是df.ix 或 df.loc。 df.at 专门针对单个单元格,消除了可能导致上述错误的歧义。
import pandas as pd
# Create a dataframe with mixed data types
df = pd.DataFrame(data={'A': [1, 2, 3], 'B': ['x', 'y', 'z']})
# Insert a list into cell 1B
df.at[1, 'B'] = ['m', 'n']
print(df)
此操作成功将['m', 'n']插入单元格1B,没有任何错误。
需要注意的是您打算插入列表的列必须将其 dtype 设置为“object”。如果列具有不同的数据类型,例如“int64”,则会发生错误。为了解决这个问题,您可以在尝试插入之前转换列的数据类型:
df = pd.DataFrame(data={'A': [1, 2, 3], 'B': [1,2,3]})
df['B'] = df['B'].astype('object')
# Now, list insertion will work as expected
df.at[1, 'B'] = [1, 2, 3]
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3