गैर-ASCII वर्णों का चयनात्मक निष्कासन
पाठ्य डेटा के साथ काम करने में अक्सर कुछ प्रतीकों को संरक्षित करते हुए गैर-ASCII वर्णों को हटाने की आवश्यकता शामिल होती है रिक्त स्थान और अवधि की तरह. हालाँकि बुनियादी फ़िल्टरिंग विधियाँ सभी गैर-ASCII वर्णों को हटा सकती हैं, लेकिन कुछ मामलों में यह वांछनीय नहीं हो सकता है। यदि ऑर्ड(चार) 127: वापसी '' अन्यथा: रिटर्न चार
यह कोड 48 से कम या 127 से अधिक ASCII मान वाले सभी वर्णों को हटा देता है, प्रभावी रूप से गैर-ASCII वर्णों के पाठ को हटा देता है। हालाँकि, यह रिक्त स्थान (ASCII 32) और अवधि (ASCII 46) को भी हटा देता है। ]
स्ट्रिंग आयात करें प्रिंट करने योग्य = सेट (स्ट्रिंग.प्रिंट करने योग्य) फ़िल्टर्ड_डेटा = फ़िल्टर (लैम्ब्डा x: x प्रिंट करने योग्य, डेटा में)def onlyascii(char):
if ord(char) 127: return ''
else: return char
s = "कुछ\x00स्ट्रिंग।\x15 अजीब पात्रों के साथ"
''.join(filter(lambda x: x in printable, s))परिणाम होगा:'somestring. अजीब पात्रों के साथ'import string
printable = set(string.printable)
filtered_data = filter(lambda x: x in printable, data)
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3