"यदि कोई कर्मचारी अपना काम अच्छी तरह से करना चाहता है, तो उसे पहले अपने औजारों को तेज करना होगा।" - कन्फ्यूशियस, "द एनालेक्ट्स ऑफ कन्फ्यूशियस। लू लिंगगोंग"
मुखपृष्ठ > प्रोग्रामिंग > रिक्त स्थान और अवधियों को संरक्षित करने वाले गैर-ASCII वर्णों को चयनात्मक रूप से कैसे हटाएं?

रिक्त स्थान और अवधियों को संरक्षित करने वाले गैर-ASCII वर्णों को चयनात्मक रूप से कैसे हटाएं?

2024-11-01 को प्रकाशित
ब्राउज़ करें:753

How to Selectively Remove Non-ASCII Characters Preserving Spaces and Periods?

गैर-ASCII वर्णों का चयनात्मक निष्कासन

पाठ्य डेटा के साथ काम करने में अक्सर कुछ प्रतीकों को संरक्षित करते हुए गैर-ASCII वर्णों को हटाने की आवश्यकता शामिल होती है रिक्त स्थान और अवधि की तरह. हालाँकि बुनियादी फ़िल्टरिंग विधियाँ सभी गैर-ASCII वर्णों को हटा सकती हैं, लेकिन कुछ मामलों में यह वांछनीय नहीं हो सकता है। यदि ऑर्ड(चार) 127: वापसी '' अन्यथा: रिटर्न चार

यह कोड 48 से कम या 127 से अधिक ASCII मान वाले सभी वर्णों को हटा देता है, प्रभावी रूप से गैर-ASCII वर्णों के पाठ को हटा देता है। हालाँकि, यह रिक्त स्थान (ASCII 32) और अवधि (ASCII 46) को भी हटा देता है। ]

स्ट्रिंग आयात करें प्रिंट करने योग्य = सेट (स्ट्रिंग.प्रिंट करने योग्य) फ़िल्टर्ड_डेटा = फ़िल्टर (लैम्ब्डा x: x प्रिंट करने योग्य, डेटा में)
def onlyascii(char):
    if ord(char)  127: return ''
    else: return char
s = "कुछ\x00स्ट्रिंग।\x15 अजीब पात्रों के साथ" ''.join(filter(lambda x: x in printable, s))

परिणाम होगा:

'somestring. अजीब पात्रों के साथ'
import string
printable = set(string.printable)
filtered_data = filter(lambda x: x in printable, data)
विज्ञप्ति वक्तव्य इस लेख को पुन: पेश किया गया है: 1729341017 यदि कोई उल्लंघन है, तो कृपया इसे हटाने के लिए [email protected] पर संपर्क करें।
नवीनतम ट्यूटोरियल अधिक>

चीनी भाषा का अध्ययन करें

अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।

Copyright© 2022 湘ICP备2022001581号-3