使用不同长度的数组从字典创建数据帧
提出的挑战是生成一个包含由不同长度的 numpy 数组组成的列的数据帧从字典中提取的值。为了实现这一点,让我们探索使用Python的解决方案。
在Python 3.x及更高版本中,可以使用以下代码片段:
import pandas as pd import numpy as np # Define a dictionary with key-value pairs representing numpy arrays d = { "A": np.random.randn(10), "B": np.random.randn(12), "C": np.random.randn(8) } # Create a dataframe by converting each key-value pair to a series df = pd.DataFrame( dict([ (k, pd.Series(v)) for k, v in d.items() ]) ) # Display the resulting dataframe print(df)
此代码创建一个包含“A”、“B”和“C”列的数据框,每个列保存字典中相应的 numpy 数组值。如果数组的长度不同,它会自动对齐它们,并使用 NaN 值作为填充来扩展较短的数组。
在 Python 2.x 中,需要进行较小的修改:
import pandas as pd import numpy as np # Define a dictionary with key-value pairs representing numpy arrays d = { "A": np.random.randn(10), "B": np.random.randn(12), "C": np.random.randn(8) } # Create a dataframe by converting each key-value pair to a series df = pd.DataFrame( dict([ (k, pd.Series(v)) for k, v in d.iteritems() ]) ) # Display the resulting dataframe print(df)
在 Python 2.x 中,使用 iteritems() 函数代替 items() 来迭代字典中的键值对。
通过利用这种方法,您可以方便地创建包含不同长度数组的列的数据框,确保数据正确对齐和处理。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3