"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > 다양한 길이의 배열을 사용하여 사전에서 Pandas 데이터 프레임을 만드는 방법은 무엇입니까?

다양한 길이의 배열을 사용하여 사전에서 Pandas 데이터 프레임을 만드는 방법은 무엇입니까?

2024년 11월 11일에 게시됨
검색:760

How to Create a Pandas Dataframe from a Dictionary with Arrays of Varying Lengths?

다양한 길이의 배열을 사용하여 사전에서 데이터프레임 생성

제시된 과제는 다양한 길이의 numpy 배열로 구성된 열이 있는 데이터프레임을 생성하는 것입니다. 사전에서 추출된 값입니다. 이를 달성하기 위해 Python을 사용하는 솔루션을 살펴보겠습니다.

Python 3.x 이상에서는 다음 코드 조각을 사용할 수 있습니다.

import pandas as pd
import numpy as np

# Define a dictionary with key-value pairs representing numpy arrays
d = {
    "A": np.random.randn(10),
    "B": np.random.randn(12),
    "C": np.random.randn(8)
}

# Create a dataframe by converting each key-value pair to a series
df = pd.DataFrame(
    dict([
        (k, pd.Series(v))
        for k, v in d.items()
    ])
)

# Display the resulting dataframe
print(df)

이 코드는 "A", "B" 및 "C" 열이 있는 데이터프레임을 생성하며, 각 열은 사전의 해당 numpy 배열 값을 보유합니다. 배열의 길이가 다양한 경우 자동으로 정렬하여 패딩으로 NaN 값을 사용하여 더 짧은 배열을 확장합니다.

Python 2.x에서는 약간의 수정이 필요합니다.

import pandas as pd
import numpy as np

# Define a dictionary with key-value pairs representing numpy arrays
d = {
    "A": np.random.randn(10),
    "B": np.random.randn(12),
    "C": np.random.randn(8)
}

# Create a dataframe by converting each key-value pair to a series
df = pd.DataFrame(
    dict([
        (k, pd.Series(v))
        for k, v in d.iteritems()
    ])
)

# Display the resulting dataframe
print(df)

Python 2.x에서는 items() 대신 iteritems() 함수를 사용하여 사전의 키-값 쌍을 반복합니다.

이 접근 방식을 활용하면, 다양한 길이의 배열이 포함된 열로 데이터프레임을 편리하게 생성하여 데이터가 올바르게 정렬되고 처리되도록 할 수 있습니다.

최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3