पायथन में सरोगेट जोड़े को सामान्य स्ट्रिंग में परिवर्तित करना
यह प्रश्न सरोगेट जोड़े वाले पायथन यूनिकोड स्ट्रिंग को एक मानक स्ट्रिंग में बदलने की एक विधि की तलाश करता है प्रतिनिधित्व. लक्ष्य एक सुगम यूनिकोड वर्ण या एक मानकीकृत हेक्साडेसिमल प्रारूप प्राप्त करना है। यह \ud83d\ude4f, एक इमोजी है।"
समस्या को हल करने के लिए, शाब्दिक सरोगेट के बीच अंतर करना महत्वपूर्ण है डिस्क पर JSON फ़ाइल में जोड़ी स्ट्रिंग (छह अक्षर) और मेमोरी में एकल-वर्ण सरोगेट जोड़ी स्ट्रिंग (एक अक्षर)।
emoji = "This is \ud83d\ude4f, an emoji."
"\ud83d\ude4f.encode('utf-16', 'surrogatepass').decode('utf -16')
यह संबंधित यूनिकोड वर्ण को आउटपुट करेगा, जिसे प्रश्न चिह्न के रूप में दर्शाया जाएगा (?):
"\ud83d\ude4f".encode('utf-16', 'surrogatepass').decode('utf-16')
डिस्क पर JSON फ़ाइल में शाब्दिक सरोगेट जोड़ी स्ट्रिंग के मामले में, JSON डेटा लोड करने के बाद सरोगेट जोड़ी मौजूद नहीं होनी चाहिए:
'?'
यह आउटपुट देगा यूनिकोड वर्ण के लिए मानकीकृत हेक्साडेसिमल प्रारूप:
ascii(json.loads(r'"\ud83d\ude4f"'))
पायथन में सरोगेट जोड़े को संभालने और उन्हें प्रयोग करने योग्य प्रारूप में परिवर्तित करने के लिए इस अंतर को समझना आवश्यक है। अस्वीकरण: उपलब्ध कराए गए सभी संसाधन आंशिक रूप से इंटरनेट से हैं। यदि आपके कॉपीराइट या अन्य अधिकारों और हितों का कोई उल्लंघन होता है, तो कृपया विस्तृत कारण बताएं और कॉपीराइट या अधिकारों और हितों का प्रमाण प्रदान करें और फिर इसे ईमेल पर भेजें: [email protected] हम इसे आपके लिए यथाशीघ्र संभालेंगे।
Copyright© 2022 湘ICP备2022001581号-3