"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > अलग-अलग सरणी लंबाई वाले शब्दकोश से पांडा डेटाफ़्रेम कैसे बनाएं?

अलग-अलग सरणी लंबाई वाले शब्दकोश से पांडा डेटाफ़्रेम कैसे बनाएं?

2024-11-09 को प्रकाशित
ब्राउज़ करें:809

How to Create a Pandas DataFrame from a Dictionary with Varying Array Lengths?

असमान प्रविष्टि लंबाई वाले शब्दकोशों से डेटाफ़्रेम बनाना

पायथन में, एक शब्दकोश से डेटाफ़्रेम बनाना संभव है जहां प्रत्येक प्रविष्टि में एक नम्पी सरणी होती है। हालाँकि, चुनौतियाँ तब उत्पन्न होती हैं जब सरणी की लंबाई प्रविष्टियों के बीच भिन्न होती है। डिफ़ॉल्ट रूप से, पांडा को समान लंबाई की सरणियों की आवश्यकता होती है, जिससे "ValueError: सभी सरणियों की लंबाई समान होनी चाहिए" जैसी त्रुटियां होती हैं। इस मुद्दे पर, हम लापता डेटा के लिए प्लेसहोल्डर के रूप में NaN (नॉट-ए-नंबर) मानों का उपयोग करने के लिए पांडा की क्षमता का लाभ उठा सकते हैं। इसका उपयोग करके, हम अलग-अलग लंबाई के कॉलम के साथ प्रभावी ढंग से एक डेटाफ़्रेम बना सकते हैं।

इसे प्राप्त करने के लिए, हम प्रत्येक शब्दकोश प्रविष्टि को पांडा श्रृंखला में परिवर्तित कर सकते हैं, एक आयामी सरणी जो लापता मानों को सहजता से संभाल सकती है। शब्दकोश आइटमों को जेनरेटर एक्सप्रेशन में लपेटकर और सीरीज कंस्ट्रक्टर का उपयोग करके, हम सीरीज ऑब्जेक्ट्स का एक शब्दकोश बना सकते हैं।pd के रूप में पांडा आयात करें एनपी के रूप में सुन्न आयात करें # असमान सरणी लंबाई के साथ नमूना डेटा डेटा = { 'ए': np.random.randn(5), 'बी': np.random.randn(8), 'सी': np.random.randn(4) } # शब्दकोश आइटम को श्रृंखला में बदलें सीरीज़_डिक्ट = डिक्ट((k, pd.Series(v)) for k, v in data.items()) # श्रृंखला के शब्दकोश से डेटाफ़्रेम बनाएं df = pd.DataFrame(series_dict)

परिणाम:

import pandas as pd
import numpy as np

# Sample data with uneven array lengths
data = {
    'A': np.random.randn(5),
    'B': np.random.randn(8),
    'C': np.random.randn(4)
}

# Convert dictionary items to Series
series_dict = dict((k, pd.Series(v)) for k, v in data.items())

# Create DataFrame from the dictionary of Series
df = pd.DataFrame(series_dict)

जैसा कि स्पष्ट है, डेटाफ़्रेम में लुप्त मान (NaN) हैं जहां सरणी की लंबाई भिन्न होती है, जिससे हमें अलग-अलग सरणी लंबाई वाले शब्दकोश से अलग-अलग कॉलम लंबाई के साथ डेटाफ़्रेम बनाने की अनुमति मिलती है।

नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3