لماذا يفشل Go Regex \\b Boundary مع الأحرف اللاتينية؟

الصفحة الأمامية > برمجة > لماذا يفشل Go Regex \\b Boundary مع الأحرف اللاتينية؟

لماذا يفشل Go Regex \\b Boundary مع الأحرف اللاتينية؟

تم النشر بتاريخ 2024-11-08

تصفح:607

$Why Does Go Regex \b Boundary Fail with Latin Characters?$

\b الحدود ذات الأحرف اللاتينية في Go Regex

في عالم التعبيرات العادية لـ Go، فإن خيار الحدود \b له ميزة طفيفة عند التعامل مع الحروف اللاتينية. تنشأ المشكلة عند محاولة تعريف الكلمات التي تحتوي على أحرف لاتينية، مثل حروف العلة المحركة والأحرف الخاصة.

فكر في المثال التالي، حيث نريد مطابقة الكلمة "vis" باستخدام خيار الحد \b:

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`\b(vis)\b`)
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}

من المثير للدهشة أن النتيجة المتوقعة لمطابقة "révisé" كخطأ لا تحدث. بدلا من ذلك، فإنه يطابق صحيحا. وذلك لأن \b يعمل فقط على حدود الكلمات ASCII.

لحل هذه المشكلة ومطابقة الأحرف اللاتينية بدقة، يمكننا استبدال حد \b ببديل أكثر شمولاً. إليك مثال:

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`)
    fmt.Println(r.MatchString("vis"))
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}

مع هذا التعديل، يتعرف التعبير العادي الآن على بداية ونهاية الكلمات باستخدام مزيج من بداية السلسلة (\A)، ونهاية السلسلة (\z)، والمسافة البيضاء (\s). تتطابق النتيجة بدقة مع "vis" كصحيح و"révisé" كخطأ:

true
true
false
false

تضمن هذه التقنية مطابقة دقيقة للكلمات، بغض النظر عن وجود الأحرف اللاتينية.

أحدث البرنامج التعليمي أكثر>

كيفية ملء مجموعة JFreechart TimeSeriesCollection ببيانات السلاسل الزمنية من قاعدة بيانات MySQL؟
نشر JFreechart TimeSeriesCollection من MySQL DB يهدف هذا السؤال إلى عرض اختلاف درجة الحرارة على مدار أيام في الشهر باستخدام JFreechart TimeSerie...

برمجة تم النشر بتاريخ 2024-11-08
خطأ القيمة: فشل تحويل مصفوفة NumPy إلى Tensor - هل تم الحل؟
خطأ في القيمة: فشل تحويل مصفوفة NumPy إلى Tensor وصف المشكلة عند محاولة تدريب شبكة عصبية باستخدام طبقات LSTM باستخدام TensorFlow، ما يلي حدث خ...

برمجة تم النشر بتاريخ 2024-11-08
لماذا لا يمكن أن يعتمد التحميل الزائد لـ Java على نوع الإرجاع؟
نوع الإرجاع الزائد في Java: عدم التوافق على الرغم من قدرات Java المتعددة الأوجه، إلا أن اللغة تفرض قيودًا عندما يتعلق الأمر بوظائف التحميل الز...

برمجة تم النشر بتاريخ 2024-11-08
مولد كلمة مرور قوية
ألقي نظرة على هذا القلم الذي صنعته!

برمجة تم النشر بتاريخ 2024-11-08
تحسينات في الزاوي و 15
1) حقن الخدمات في Angular 14 بدون مُنشئ باستخدام inject. في السابق، كان الفصل الذي يحتوي على مُنشئ مطلوبًا دائمًا لإدخال أي خدمة: class MyClass ...

برمجة تم النشر بتاريخ 2024-11-08
البرمجة الموجهة للكائنات: خطوتك الأولى نحو إتقان DSA
Imagine you're walking through a bustling factory. You see different machines, each designed for a specific purpose, working together to create a fina...

برمجة تم النشر بتاريخ 2024-11-08
$كيفية إصلاح الخطأ \"لا يمكن تحويل قيمة النوع java.lang.String إلى JSONObject\" في Android؟$
كيفية إصلاح الخطأ \"لا يمكن تحويل قيمة النوع java.lang.String إلى JSONObject\" في Android؟
استكشاف أخطاء "قيمة \u003cbr\u003e من النوع java.lang.String لا يمكن تحويلها إلى JSONObject" خطأ في تطبيق Android الخاص بك ، فأنت توا...

برمجة تم النشر بتاريخ 2024-11-08
كيفية فرض تحديث قوي في JavaScript ومنع مشكلات التخزين المؤقت؟
حل مشكلات التخزين المؤقت لجافا سكريبت: مسح ذاكرة التخزين المؤقت باستخدام جافا سكريبت عند نشر كود جافا سكريبت الجديد، من المحبط عدم رؤية آخر ال...

برمجة تم النشر بتاريخ 2024-11-08
كيفية تحويل الأعداد الصحيحة إلى كلمات في بايثون باستخدام Inflect؟
تحويل الأعداد الصحيحة إلى كلمات في بايثون يمكن أن يكون تحويل القيم الرقمية إلى تمثيلات الكلمات المقابلة لها مهمة محيرة في بايثون. تستكشف هذه ا...

برمجة تم النشر بتاريخ 2024-11-08
هل يؤدي إغلاق نص الاستجابة إلى تمكين إعادة استخدام الاتصال في عميل Go HTTP؟
إعادة استخدام اتصال عميل Go HTTP: المفاهيم الخاطئة الشائعة تم تصميم عميل Go HTTP لإعادة استخدام الاتصالات بشكل افتراضي، مما يوفر استخدامًا فعا...

برمجة تم النشر بتاريخ 2024-11-08
كيفية إعادة توجيه المخرجات القياسية وتدفقات الأخطاء ديناميكيًا في وظائف بايثون؟
إعادة توجيه الدفق السياقي في بايثون أثبتت إعادة توجيه المخرجات القياسية وتدفقات الأخطاء (stdout و stderr) أنها مفيدة في العديد من السيناريوهات...

برمجة تم النشر بتاريخ 2024-11-08
كيف يمكنك حساب حجم الملف أو المجلد بكفاءة في Java؟
الحصول على حجم ملف أو مجلد في Java يعد استرداد حجم ملف أو مجلد مهمة شائعة عند العمل مع الملفات في جافا. إليك كيفية القيام بذلك بفعالية:الحصول ...

برمجة تم النشر بتاريخ 2024-11-08
المتغيرات الجزء-04
মনে করুন আপনি চা খাবেন। না, চা না। কফিই খান। প্রোগ্রামার হচ্ছেন কফি তো খেতেন পারেন। কফিকে প্রোগ্রামারদের সঙ্গি বললে ভুল হবে না । যাই হোক। এখন কফি তৈর...

برمجة تم النشر بتاريخ 2024-11-08
الأشياء التي أتمنى أن أعرفها عندما بدأت مع React
دروس من 3 سنوات من تطوير React عندما دخلت في React لأول مرة، شعرت وكأنني أفتح صندوق باندورا. كان هناك الكثير لأتعلمه، وعلى طول الطريق، واجهت ا...

برمجة تم النشر بتاريخ 2024-11-08
كتابة تطبيق CLI لاختبار سرعة الكتابة في Golang
هل كان عليك التفكير طويلًا وصعبًا بشأن هذا العنوان؟... الآن بعد أن انتهينا من ذلك، دعنا نكتب بعض التعليمات البرمجية الرتق :) فرامل المضخات؟ صراخهه...

برمجة تم النشر بتاريخ 2024-11-08