"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > एक डेटाफ़्रेम में मौजूद पंक्तियों को कैसे खोजें, लेकिन दूसरे में नहीं (df1 और df2 की तुलना करें)?

एक डेटाफ़्रेम में मौजूद पंक्तियों को कैसे खोजें, लेकिन दूसरे में नहीं (df1 और df2 की तुलना करें)?

2024-11-07 को प्रकाशित
ब्राउज़ करें:729

How to Find Rows Present in One Dataframe but Not in Another (Comparing df1 and df2)?

डेटाफ़्रेम की तुलना करना: एक में मौजूद पंक्तियों को ढूंढना, लेकिन दूसरे में नहीं

अंतरों की पहचान करने के लिए डेटाफ़्रेम की तुलना करना डेटा गुणवत्ता आश्वासन और विलय के लिए महत्वपूर्ण है परिचालन. इस मामले में, हमारे पास एक विशिष्ट संरचना के साथ दो डेटाफ्रेम (df1 और df2) हैं और df2 में मौजूद पंक्तियों को निर्धारित करने की आवश्यकता है, लेकिन df1 में नहीं।

प्रारंभ में, df1 का उपयोग करके डेटाफ्रेम की तुलना करने का प्रयास किया गया! एक गलती। यह दृष्टिकोण केवल समान पंक्तियों और स्तंभों वाले डेटाफ़्रेम के लिए काम करता है। सममित अंतर खोजने के लिए, हमें एक अलग दृष्टिकोण की आवश्यकता है।

एक विधि में डेटाफ्रेम को जोड़ना शामिल है:

df = pd.concat([df1, df2])
df = df.reset_index(drop=True)

फिर, सभी कॉलमों द्वारा संयोजित डेटाफ्रेम को समूहीकृत करना:

df_gpby = df.groupby(list(df.columns))

इसके बाद, हम सूचकांक मान प्राप्त करके अद्वितीय रिकॉर्ड की पहचान करते हैं जहां केवल एक पंक्ति मौजूद है:

idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]

इन सूचकांकों का उपयोग करके, हम वांछित परिणाम प्राप्त करने के लिए डेटाफ्रेम को फ़िल्टर कर सकते हैं:

df.reindex(idx)

यह दृष्टिकोण df2 में मौजूद लेकिन अनुपस्थित पंक्तियों को प्रदान करता है दिनांक सूचकांक और फल स्तंभ की तुलना के आधार पर df1 में।

विज्ञप्ति वक्तव्य यह लेख यहां पुनर्मुद्रित है: 1729343178 यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए स्टडी_गोलंग@163.कॉम से संपर्क करें।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3