”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 如何从具有不同长度数组的字典创建 Pandas 数据框?

如何从具有不同长度数组的字典创建 Pandas 数据框?

发布于2024-11-11
浏览:845

How to Create a Pandas Dataframe from a Dictionary with Arrays of Varying Lengths?

使用不同长度的数组从字典创建数据帧

提出的挑战是生成一个包含由不同长度的 numpy 数组组成的列的数据帧从字典中提取的值。为了实现这一点,让我们探索使用Python的解决方案。

在Python 3.x及更高版本中,可以使用以下代码片段:

import pandas as pd
import numpy as np

# Define a dictionary with key-value pairs representing numpy arrays
d = {
    "A": np.random.randn(10),
    "B": np.random.randn(12),
    "C": np.random.randn(8)
}

# Create a dataframe by converting each key-value pair to a series
df = pd.DataFrame(
    dict([
        (k, pd.Series(v))
        for k, v in d.items()
    ])
)

# Display the resulting dataframe
print(df)

此代码创建一个包含“A”、“B”和“C”列的数据框,每个列保存字典中相应的 numpy 数组值。如果数组的长度不同,它会自动对齐它们,并使用 NaN 值作为填充来扩展较短的数组。

在 Python 2.x 中,需要进行较小的修改:

import pandas as pd
import numpy as np

# Define a dictionary with key-value pairs representing numpy arrays
d = {
    "A": np.random.randn(10),
    "B": np.random.randn(12),
    "C": np.random.randn(8)
}

# Create a dataframe by converting each key-value pair to a series
df = pd.DataFrame(
    dict([
        (k, pd.Series(v))
        for k, v in d.iteritems()
    ])
)

# Display the resulting dataframe
print(df)

在 Python 2.x 中,使用 iteritems() 函数代替 items() 来迭代字典中的键值对。

通过利用这种方法,您可以方便地创建包含不同长度数组的列的数据框,确保数据正确对齐和处理。

最新教程 更多>

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3