استخدام ترميز UTF-8 في كود مصدر Python
في بعض السيناريوهات، قد تواجه أخطاء تتعلق بأحرف غير ASCII عند العمل مع سلاسل Unicode في كود مصدر بايثون. وذلك لأن الترميز الافتراضي لملفات مصدر Python 2 ليس UTF-8.
الإعلان عن سلاسل UTF-8
في Python 3، UTF-8 هو الافتراضي ترميز المصدر، بحيث يمكنك استخدام أحرف Unicode مباشرة دون أي إعلان خاص. ومع ذلك، في Python 2، تحتاج إلى الإعلان بشكل صريح عن ترميز UTF-8 في رأس الملف المصدر باستخدام الصيغة التالية:
# -*- coding: utf-8 -*-
ضع هذا السطر في بداية ملف مصدر Python 2.
على سبيل المثال، ضع في اعتبارك رمز Python 2 التالي:
# -*- coding: utf-8 -*-
u = 'idzie wąż wąską dróżką'
uu = u.decode('utf8')
s = uu.encode('cp1250')
print(s)
يستخدم هذا الرمز ترميز UTF-8 ويحول سلسلة Unicode بنجاح إلى سلسلة بايت مشفرة CP1250 للطباعة.
من خلال الإعلان عن ترميز UTF-8، فإنك تضمن أن Python سوف يفسر أحرف Unicode بشكل صحيح ويتجنب الأخطاء المتعلقة بالأحرف غير ASCII. ومن المهم ملاحظة أنه يجب وضع هذا الإعلان في بداية الملف المصدر، قبل أي كود آخر.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3