مطابقة عناوين URL مع التعبيرات العادية
يمكن أن تكون التعبيرات العادية شاقة في البداية، ولكنها توفر إمكانات قوية لمطابقة الأنماط لأنواع البيانات المتنوعة. في سياق استخراج عناوين URL، يعد النمط المرن ضروريًا لاستيعاب الاختلافات في تنسيقات عناوين URL.
تعبير عادي قوي يمكنه التقاط عناوين URL مع أو بدون بروتوكولات رائدة (على سبيل المثال، "http://www" أو " www") هو:
((https?|ftp)://)? // Optional SCHEME ([a-z0-9 !*(),;?&=$_.-] (:[a-z0-9 !*(),;?&=$_.-] )?@)? // Optional User and Pass ([a-z0-9\-\.]*)\.(([a-z]{2,4})|([0-9]{1,3}\.([0-9]{1,3})\.([0-9]{1,3}))) // Host or IP address (:[0-9]{2,5})? // Optional Port (/([a-z0-9 $_%-]\.?) )*/? // Path (\?[a-z &\$_.-][a-z0-9;:@&%= /$_.-]*)? // Optional GET Query (#[a-z_.-][a-z0-9 $%_.-]*)? // Optional Anchor
لاستخدام هذا التعبير في PHP، ضعه بين علامتي اقتباس مزدوجتين وقم بتمريره إلى وظيفة preg_match مع عنوان URL الذي تريد تقييمه. على سبيل المثال:
$url = 'www.example.com/etcetc';
if (preg_match("~^$regex$~i", $url)) {
echo 'Matched URL without protocol';
}
وبالمثل، بالنسبة لعناوين URL التي تحتوي على بروتوكولات:
$url = 'http://www.example.com/etcetc';
if (preg_match("~^$regex$~i", $url)) {
echo 'Matched URL with protocol';
}
يجب أن يغطي هذا النمط نطاقًا واسعًا من تنسيقات عناوين URL مع الحماية أيضًا من المدخلات الضارة المحتملة التي تحتوي على أحرف مثل "/".
تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.
Copyright© 2022 湘ICP备2022001581号-3