] डेटा, विश्लेषण के लिए इसे तैयार करने के लिए विराम चिह्न को हटाना आवश्यक है। इस कार्य में विराम चिह्न के रूप में परिभाषित किसी भी वर्ण को पहचानना और फ़िल्टर करना शामिल है। पांडा के str.Replace जैसे कार्यों में कम्प्यूटेशनल रूप से महंगा हो सकता है। सैकड़ों हजारों अभिलेखों के साथ काम करते समय यह विशेष रूप से महत्वपूर्ण हो जाता है।
एक पूर्व-संकलित रेगेक्स पैटर्न के साथ आरई लाइब्रेरी से उप फ़ंक्शन का उपयोग करता है। यह विधि str.Replace पर एक महत्वपूर्ण प्रदर्शन सुधार प्रदान करती है।
2। str.Translate:
पायथन के str.translate फ़ंक्शन का लाभ उठाता है, जो c में लागू किया गया है और इसकी गति के लिए जाना जाता है। प्रक्रिया में इनपुट स्ट्रिंग्स को एक बड़े स्ट्रिंग में परिवर्तित करना, विराम चिह्न को हटाने के लिए अनुवाद लागू करना और फिर मूल स्ट्रिंग्स को फिर से संगठित करने के लिए परिणाम को विभाजित करना शामिल है।
३। अन्य विचार:
आपको उनके सूचकांकों की पहचान करके और प्रतिस्थापन को केवल गैर-नल मानों पर लागू करके उन्हें अलग से संभालने की आवश्यकता होगी। और इसे मूल आकार में वापस लाने से पहले चपटा सरणी पर प्रतिस्थापन करें।
लगातार अन्य तरीकों से बेहतर प्रदर्शन करता है, विशेष रूप से बड़े डेटासेट के लिए। प्रदर्शन और मेमोरी उपयोग के बीच ट्रेडऑफ पर विचार करना महत्वपूर्ण है, क्योंकि str.translate को अधिक मेमोरी की आवश्यकता होती है। आपकी स्थिति की आवश्यकताएं। यदि प्रदर्शन सर्वोच्च प्राथमिकता है, तो Str.Translate सबसे अच्छा विकल्प प्रदान करता है। हालाँकि, यदि मेमोरी उपयोग एक चिंता का विषय है, तो Regex.sub जैसे अन्य तरीके अधिक उपयुक्त हो सकते हैं।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3