] पायथन 2 पर U '' उपसर्ग का उपयोग करके यूनिकोड स्ट्रिंग्स को नामित किया जाना चाहिए। इसके अलावा, re.unicode ध्वज को नियमित अभिव्यक्ति में पारित किया जाना चाहिए, और इनपुट डेटा को कोडेक्स का उपयोग करके यूनिकोड में परिवर्तित किया जाना चाहिए:
] आयात कोडेक आयात पुनः पाठ = codecs.decode ('यह कुत्ता \ u0001f602'.encode (' UTF-8 '),' UTF-8 ') प्रिंट (पाठ) # इमोजी के साथ emoji_pattern = re.compile ("[" [" u "\ u0001f600- \ u0001f64f" # इमोटिकॉन्स u "\ u0001f300- \ u0001f5ff" # प्रतीक और चित्रकारक U "\ u0001f680- \ u0001f6ff" # परिवहन और मानचित्र प्रतीक u "\ u0001f1e0- \ u0001f1ff" # झंडे (iOS) "]", झंडे = re.unicode) प्रिंट (emoji_pattern.sub (r '', पाठ)) # no emoji
पूर्व>
नोट: यह पैटर्न केवल इमोजी की एक सीमित सीमा से मेल खाता है। अधिक व्यापक समाधान के लिए, यूनिकोड चरित्र श्रेणियों को देखें।
अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3