التكرار عبر نقاط ترميز Unicode في سلاسل Java
بينما توفر فئة String طريقة codePointAt(int) للوصول إلى نقاط ترميز Unicode، فإن فهرستها تعتمد على على إزاحات الأحرف بدلاً من إزاحات نقاط التعليمات البرمجية. وهذا يثير مخاوف بشأن التعامل مع الأحرف ضمن النطاق البديل العالي وكفاءة نهج التكرار المقترح باستخدام المسح لكل حرف على حدة.
حل التكرار المحسن
جافا يستخدم تمثيل السلسلة الداخلية نظام ترميز يستند إلى UTF-16. يتم ترميز الأحرف الموجودة خارج المستوى الأساسي متعدد اللغات (BMP) باستخدام نظام تأجير الأرحام. للحصول على تكرار فعال، فكر في استخدام النهج الأساسي التالي:final int length = s.length();
for (int offset = 0; offset يتعامل هذا الأسلوب بشكل صحيح مع الأزواج البديلة للأحرف خارج BMP. من خلال استخدام Character.charCount(codepoint)، فإنه يزيد بكفاءة الإزاحة عن طريق العدد المناسب من الأحرف لكل نقطة تشفير.
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3