"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > برمجة > كيفية استخراج نقاط رمز UCS-2 من أحرف UTF-8 في PHP؟

كيفية استخراج نقاط رمز UCS-2 من أحرف UTF-8 في PHP؟

نشر في 2025-02-06
تصفح:454

How to Extract UCS-2 Code Points from UTF-8 Characters in PHP?

للأحرف داخل سلسلة UTF-8 معينة. لإنجاز هذا ، يمكن تعريف وظيفة PHP مخصصة.

أولاً ، من المهم فهم مخطط ترميز UTF-8. يتم تمثيل كل حرف بتسلسل من 1 إلى 4 بايت ، اعتمادًا على نقطة رمز Unicode. النطاقات لكل حجم بايت هي كما يلي:

0xxxxxxx: 1 byte

&&&&& &&&&&&] 110: 2 byte character

1110: 3 حرف بايت
    &&&]
  • بمجرد تحديد عدد البايتات ، يمكن استخدام معالجة البت لاستخراج نقطة الكود.
  • في التحليل أعلاه ، إليك وظيفة PHP مخصصة تأخذ حرف UTF-8 واحد كمدخلات وإرجاع نقطة رمز UCS-2:
  • { // تهيئة نقطة الكود $ codepoint = 0 ؛ // احصل على البايت الأول $ firstbyte = ord ($ char) ؛ // تحديد عدد البايتات if ($ firstbyte
  • مثال الاستخدام:

لاستخدام الوظيفة ، ما عليك سوى توفير حرف UTF-8 كمدخلات:
  • $ char = " - "؛ $ codepoint = get_ucs2_codepoint ($ char) ؛ صدى "ucs-2 نقطة الرمز: $ codepoint \ n" ؛
  • الإخراج:
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3