बूलियन इंडेक्सिंग का उपयोग करके पांडा डेटा ऑब्जेक्ट को कुशलतापूर्वक कैसे फ़िल्टर करें?

मुखपृष्ठ > प्रोग्रामिंग > बूलियन इंडेक्सिंग का उपयोग करके पांडा डेटा ऑब्जेक्ट को कुशलतापूर्वक कैसे फ़िल्टर करें?

बूलियन इंडेक्सिंग का उपयोग करके पांडा डेटा ऑब्जेक्ट को कुशलतापूर्वक कैसे फ़िल्टर करें?

2024-11-01 को प्रकाशित

ब्राउज़ करें:490

How to Efficiently Filter Pandas Data Objects Using Boolean Indexing?

बूलियन इंडेक्सिंग का उपयोग करके पांडा डेटाफ्रेम और श्रृंखला की कुशल फ़िल्टरिंग

डेटा विश्लेषण परिदृश्यों में, परिणामों को कम करने के लिए कई फ़िल्टर लागू करना अक्सर महत्वपूर्ण होता है। इस लेख का उद्देश्य पांडा डेटा ऑब्जेक्ट पर कई तुलना संचालन को श्रृंखलाबद्ध करने के लिए एक कुशल दृष्टिकोण को संबोधित करना है। श्रृंखला या डेटाफ़्रेम, जिसके परिणामस्वरूप फ़िल्टर किया गया डेटासेट प्राप्त होता है। इस ऑपरेशन के लिए अनावश्यक डेटा प्रतिलिपि को कम करने की आवश्यकता होती है, खासकर जब बड़े डेटासेट से निपटते हैं।

समाधान: बूलियन इंडेक्सिंग

पांडा बूलियन इंडेक्सिंग का उपयोग करके डेटा को फ़िल्टर करने के लिए एक अत्यधिक कुशल तंत्र प्रदान करता है। बूलियन इंडेक्सिंग में तार्किक स्थितियाँ बनाना और फिर इन शर्तों का उपयोग करके डेटा को अनुक्रमित करना शामिल है। निम्नलिखित उदाहरण पर विचार करें:

df.loc[df['col1'] >= 1, 'col1']

कोड की यह पंक्ति डेटाफ़्रेम डीएफ में सभी पंक्तियों का चयन करती है जहां 'col1' कॉलम में मान 1 से अधिक या उसके बराबर है। परिणाम एक नई श्रृंखला ऑब्जेक्ट है जिसमें फ़िल्टर किए गए मान शामिल हैं।

df.loc[df['col1'] >= 1, 'col1']

df[(df['col1'] >= 1) & (df['col1'] यह ऑपरेशन उन पंक्तियों को फ़िल्टर करता है जहां 'col1' 1 से बड़ा या उसके बराबर और 1 से कम या उसके बराबर दोनों है।

df[(df['col1'] >= 1) & (df['col1'] <= 1)]

कई फ़िल्टर लागू करने की प्रक्रिया को सरल बनाने के लिए, हम सहायक कार्य बना सकते हैं:

def b(x, col, op, n): वापसी ऑप(x[col], n) डीईएफ़ एफ(एक्स, *बी): रिटर्न x[(np.ological_and(*b))]

b फ़ंक्शन किसी दिए गए कॉलम और ऑपरेटर के लिए एक बूलियन स्थिति बनाता है, जबकि f एक डेटाफ़्रेम या श्रृंखला में कई बूलियन शर्तें लागू करता है।

def b(x, col, op, n): 
    return op(x[col], n)

def f(x, *b):
    return x[(np.logical_and(*b))]

इन कार्यों का उपयोग करने के लिए, हम फ़िल्टर मानदंड का एक शब्दकोश प्रदान कर सकते हैं:

फ़िल्टर = {'>=': [1], '

filters = {'>=': [1], 'यह कोड डेटाफ़्रेम डीएफ में 'col1' कॉलम पर फ़िल्टर लागू करता है और फ़िल्टर किए गए परिणामों के साथ एक नया डेटाफ़्रेम लौटाता है।b1 = b(df, 'col1', ge, 1)
b2 = b(df, 'col1', le, 1)
filtered_df = f(df, b1, b2)
पांडास 0.13 ने क्वेरी विधि पेश की, जो स्ट्रिंग अभिव्यक्तियों का उपयोग करके फ़िल्टर लागू करने का एक सुविधाजनक तरीका प्रदान करती है। मान्य कॉलम पहचानकर्ताओं के लिए, निम्नलिखित कोड संभव हो जाता है:
df.query('col1 यह लाइन हमारी तरह ही फ़िल्टरिंग प्राप्त करती है अधिक संक्षिप्त सिंटैक्स का उपयोग करते हुए पिछला उदाहरण।df.query('col1

विज्ञप्ति वक्तव्य यह लेख यहां पुनर्मुद्रित है: 1729395079 यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए स्टडी_गोलंग@163.कॉम से संपर्क करें।

नवीनतम ट्यूटोरियल अधिक>

CSS फ़ॉन्ट विशेषता अपरिभाषित होने पर जावास्क्रिप्ट में वास्तविक प्रदान किए गए फ़ॉन्ट को कैसे प्राप्त करें?
तक पहुँचने पर वास्तविक रेंडर किए गए फ़ॉन्ट को एक्सेस करना जब css में अपरिभाषित किया जाता है, जब किसी तत्व के फ़ॉन्ट गुणों तक पहुँचते हैं, तो...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
गो वेब एप्लिकेशन कब डेटाबेस कनेक्शन को बंद करता है?
] यहाँ एक गहरी गोता है कि कब और कैसे इसे अनिश्चित काल तक चलने वाले अनुप्रयोगों में संभालना है। func मुख्य () { var इर त्रुटि DB, ERR = SQL.OPE...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
गतिशील रूप से आकार के मूल तत्व के भीतर एक तत्व की स्क्रॉलिंग रेंज को कैसे सीमित करें?
] इस तरह के एक परिदृश्य में गतिशील रूप से आकार के मूल तत्व के भीतर एक तत्व की स्क्रॉलिंग रेंज को सीमित करना शामिल है। हालाँकि, मानचित्र की स्क्रॉलिंग ...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
मैं नंबर-केवल आउटपुट के साथ एकल अंक मान्यता के लिए pytesseract को कैसे कॉन्फ़िगर कर सकता हूं?
] इस समस्या को संबोधित करने के लिए, हम Tesseract के कॉन्फ़िगरेशन विकल्पों की बारीकियों में तल्लीन करते हैं। एकल वर्ण मान्यता के लिए, उपयुक्त PSM 10 है...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
जावा के पूर्ण-स्क्रीन अनन्य मोड में उपयोगकर्ता इनपुट को कैसे संभालें?
java में पूर्ण स्क्रीन अनन्य मोड में उपयोगकर्ता इनपुट को संभालना, जब पूर्ण स्क्रीन अनन्य मोड में एक जावा एप्लिकेशन चलाना अपेक्षित नहीं हो ...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
मैं नोड-MYSQL का उपयोग करके एक ही क्वेरी में कई SQL स्टेटमेंट को कैसे निष्पादित कर सकता हूं?
बयानों को अलग करने के लिए अर्ध-उपनिवेश (;)। हालाँकि, यह एक त्रुटि है कि SQL सिंटैक्स में कोई त्रुटि है। इस सुविधा को सक्षम करने के लिए, आपको एक कनेक्...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
Installutil.exe का उपयोग करने के बाद Add/Remove प्रोग्राम में मेरी विंडोज सेवा क्यों नहीं दिखाई देती है?
] ] ऐसा इसलिए है क्योंकि installutil.exe मुख्य रूप से एक डेवलपर टूल है, न कि उत्पादन परिनियोजन समाधान। ] ] यहाँ कुछ लोकप्रिय विकल्प हैं: ] wi...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
मैं अलग -अलग संख्याओं के साथ डेटाबेस टेबल कैसे कर सकता हूं?
] विभिन्न कॉलम के साथ डेटाबेस तालिकाओं को मर्ज करने की कोशिश करते समय चुनौतियों का सामना कर सकते हैं। एक सीधा तरीका कम कॉलम के साथ एक तालिका में ल...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
मुझे MySQL त्रुटि #1089 क्यों मिल रही है: गलत उपसर्ग कुंजी?
] आइए इस त्रुटि और इसके रिज़ॉल्यूशन की बारीकियों में तल्लीन करें। उपसर्ग कुंजियों को स्ट्रिंग कॉलम की एक विशिष्ट उपसर्ग लंबाई को अनुक्रमित करने के लिए...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
क्या SQL सर्वर क्वेरी डेटा का चयन करने के लिए सीरियल नंबर स्थानों का उपयोग कर सकता है?
हालांकि, कभी -कभी डेटा आयात प्रक्रियाओं जैसे कुछ परिदृश्यों में, यह आवश्यक हो सकता है। यह लेख यह बताता है कि क्या SQL सर्वर में डेटा का चयन करने के ल...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
मैं PHP का उपयोग करके XML फ़ाइलों से विशेषता मानों को कैसे प्राप्त कर सकता हूं?
] एक XML फ़ाइल के साथ काम करते समय, जिसमें प्रदान किए गए उदाहरण की विशेषताएं होती हैं: 1 स्टंप किया गया। इसे हल करने के लिए, PHP सिंप्लेक्...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
वर्तमान में जावास्क्रिप्ट को निष्पादित करने वाली स्क्रिप्ट तत्व विधि का पता लगाएं
] हालाँकि, दस्तावेज़ का उपयोग करने की पारंपरिक विधि। getElementsByTagName ('हेड') [0] .AppendChild (v) उपयुक्त नहीं हो सकती है यदि हेड तत्व को...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
PHP में कर्ल के साथ एक कच्ची पोस्ट अनुरोध कैसे भेजें?
] यह लेख एक कच्चे पोस्ट अनुरोध करने के लिए कर्ल का उपयोग करने का तरीका प्रदर्शित करेगा, जहां डेटा को अनएन्कोडेड फॉर्म में भेजा जाता है। फिर, निम्न विक...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
क्या गाइड विशिष्टता की गारंटी दे सकते हैं? व्यावहारिक प्रदर्शन
] ] यह लेख GUID की गैर-अवहेलना को प्रदर्शित करने के लिए एक सरल C# कार्यक्रम प्रदान करता है और कार्यक्रम की स्थिरता और प्रदर्शन में सुधार करने के लि...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया
गो लैंग्वेज कचरा संग्रह में कटा हुआ मेमोरी से कैसे निपटें?
] स्लाइस के साथ काम करते समय, संभावित मेमोरी लीक से बचने के लिए कचरा संग्रह व्यवहार को समझना महत्वपूर्ण होता है। r: = (*q) [0] *क्यू = (*क्यू)...

प्रोग्रामिंग 2025-04-18 को पोस्ट किया गया