"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > असमान सरणी लंबाई वाले शब्दकोशों से पांडा डेटाफ़्रेम का निर्माण कैसे करें?

असमान सरणी लंबाई वाले शब्दकोशों से पांडा डेटाफ़्रेम का निर्माण कैसे करें?

2024-11-14 को प्रकाशित
ब्राउज़ करें:794

How to Construct Pandas DataFrames from Dictionaries with Uneven Array Lengths?

असमान सरणी लंबाई वाले शब्दकोशों से डेटाफ़्रेम का निर्माण

पांडा में असमान लंबाई वाले शब्दकोशों को संभालने के लिए एक अनुरूप दृष्टिकोण की आवश्यकता होती है। जब शब्दकोश के भीतर एक सरणी का प्रतिनिधित्व करने वाले प्रत्येक कॉलम के साथ डेटाफ़्रेम बनाने का प्रयास किया जाता है, तो किसी को वैल्यूएरर का सामना करना पड़ सकता है: "सभी सरणी समान लंबाई की होनी चाहिए।"

श्रृंखला ऑब्जेक्ट का लाभ उठाना

इसे रोकने के लिए समस्या, हम पांडा श्रृंखला की वस्तुओं का लाभ उठाते हैं जो अलग-अलग लंबाई की सारणी रख सकती हैं। प्रत्येक शब्दकोश मान को एक श्रृंखला में परिवर्तित करके, हम उनकी लंबाई की परवाह किए बिना सरणियों को प्रभावी ढंग से संग्रहीत कर सकते हैं। निम्नलिखित कोड स्निपेट इस दृष्टिकोण को प्रदर्शित करता है:

import pandas as pd
import numpy as np

# Sample data generated via a reproducible seed
np.random.seed(2023)
data = {k: np.random.randn(v) for k, v in zip("ABCDEF", [10, 12, 15, 17, 20, 23])}

# Convert dictionary values to Series objects
series_dict = {k: pd.Series(v) for k, v in data.items()}

# Create DataFrame using these Series objects
df = pd.DataFrame(series_dict)

लापता मानों को संरक्षित करना

विभिन्न लंबाई के सरणियों के साथ काम करते समय, गुम मानों का सामना करना आम बात है जहां छोटे सरणियाँ शेष कोशिकाओं को नहीं भर सकती हैं। डिफ़ॉल्ट रूप से, पांडा इन अंतरालों को NaN (संख्या नहीं) मानों से भरते हैं। यह व्यवहार विश्लेषण के लिए एक सुसंगत संरचना प्रदान करते हुए मूल डेटा को संरक्षित करता है। ) कंस्ट्रक्टर. उदाहरण के लिए, लुप्त मानों को NaN के बजाय शून्य से बदलने के लिए, आप missing_values=0 निर्दिष्ट करेंगे जैसा कि नीचे दिखाया गया है:

df = pd.DataFrame(series_dict, missing_values=0)

उदाहरण आउटपुट

df = pd.DataFrame(series_dict, missing_values=0)

प्रिंट(डीएफ)

ए बी सी डी ई एफ 0 0.711674 -1.076522 -1.502178 -1.519748 0.340619 0.051132 1 -0.324485 -0.325682 -1.379593 2.097329 -1.253501 -0.238061 2 -1.001871 -1.035498 -0.204455 0.892562 0.370788 -0.208009 3 0.236251 -0.426320 0.642125 1.596488 0.455254 0.401304 4 -0.102160 -1.029361 -0.181176 -0.638762 -2.283720 0.183169 ... ... ... ... ... ... ... 18 NaN NaN NaN NaN NaN NaN 19 NaN NaN NaN NaN NaN NaN 20 NaN NaN NaN NaN NaN NaN 21 NaN NaN NaN NaN NaN NaN 22 NaN NaN NaN NaN NaN NaN 23 पंक्तियाँ × 6 कॉलम

print(df)
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3