गैर-ASCII वर्णों को संभालना, रिक्त स्थान और अवधियों को संरक्षित करना
पाठ फ़ाइलों से निपटते समय, गैर-ASCII वर्णों को हटाना अक्सर आवश्यक होता है रिक्त स्थान और अवधियों जैसी विशिष्ट संस्थाओं को संरक्षित करना। प्रदान किया गया पायथन कोड गैर-ASCII वर्णों को सफलतापूर्वक फ़िल्टर करता है, लेकिन अनजाने में रिक्त स्थान और अवधियों को भी हटा देता है।
इस समस्या को हल करने के लिए, हमें फ़िल्टरिंग प्रक्रिया से रिक्त स्थान और अवधियों को स्पष्ट रूप से बाहर करने के लिए केवल ओनलीएएससीआईआई () फ़ंक्शन को संशोधित करने की आवश्यकता है। . यहां एक अद्यतन संस्करण है:
def onlyascii(char):
if char == ' ' or char == '.':
return char
elif ord(char) 127:
return ''
else:
return char
इस संशोधित ओनलीएएससीआईआई() फ़ंक्शन में, हम जांचते हैं कि क्या कैरेक्टर एक स्पेस ('') या एक पीरियड ('.') है और यदि ऐसा है तो इसे वापस कर देते हैं। यह संशोधन सुनिश्चित करता है कि इन इकाइयों को फ़िल्टर किए गए स्ट्रिंग में बनाए रखा गया है। &&&]def get_my_string(file_path): एफ = खुला (फ़ाइल_पथ, 'आर') डेटा = f.read() च.बंद करें() फ़िल्टर_डेटा = फ़िल्टर(onlyascii, डेटा) फ़िल्टर्ड_डेटा = फ़िल्टर्ड_डेटा.लोअर() रिटर्न ''.join(filtered_data)
ज्वाइन() विधि का उपयोग फिल्टर() फ़ंक्शन द्वारा लौटाए गए पुनरावर्तनीय से वर्णों को जोड़ने के लिए किया जाता है, जिसके परिणामस्वरूप एक स्ट्रिंग बनती है।
इन्हें लागू करके संशोधनों के अनुसार, आप अपनी विशिष्ट परियोजना आवश्यकताओं को पूरा करते हुए, अपनी टेक्स्ट स्ट्रिंग में रिक्त स्थान और अवधियों को संरक्षित करते हुए गैर-ASCII वर्णों को हटा सकते हैं।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3