كيفية التعامل مع الأزواج البديلة في Python Unicodes
في Python، يتم استخدام الأزواج البديلة لتمثيل أحرف Unicode خارج المستوى الأساسي متعدد اللغات (BMP) ). تتكون هذه الأزواج من نقطتي رمز بديلتين يتم استخدامهما لترميز حرف Unicode واحد.
عند العمل مع سلاسل Python Unicode التي تحتوي على أزواج بديلة، قد تواجه أخطاء تتعلق بالتشفير البديل. تحدث هذه الأخطاء لأن بايثون تتعامل مع الأزواج البديلة بشكل مختلف اعتمادًا على السياق.
التعامل مع الأزواج البديلة
لتحويل زوج بديل إلى سلسلة عادية، لديك عدة خيارات:
استخدم json الوحدة النمطية:
التشفير وفك التشفير باستخدام encode () الطريقة: ] &&&]
قم بتشفير السلسلة باستخدام برنامج ترميز يدعم الأزواج البديلة، مثل "utf-16" أو "utf-16-le".emoji = "This is \ud83d\ude4f, an emoji."
encoded = emoji.encode("utf-16")
decoded = encoded.decode("utf-16")
print(decoded) # Output: "This is ?, an emoji."
إذا واجهت خطأ أثناء التشفير أو فك التشفير، فيمكنك استخدام معالج أخطاء المرور البديل لتجاهل البديل زوج.
encoded = emoji.encode("utf-16", "surrogatepass")
decoded = encoded.decode("utf-16")
print(decoded) # Output: "?"
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3