"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > برمجة > معالجة الفراغات الاختيارية في تعبيرات منتظمة لاستخراج البيانات بدقة

معالجة الفراغات الاختيارية في تعبيرات منتظمة لاستخراج البيانات بدقة

نشر في 2025-04-14
تصفح:790

How to Handle Optional Whitespace in Regular Expressions for Accurate Data Extraction?

يمكن أن يكون هذا أمرًا صعبًا عند كتابة تعبيرات منتظمة لاستخراج البيانات بدقة.

ضع في اعتبارك الكود التالي: preg_match ('#& lt ؛ a href = & quot ؛ (.*؟) & quot ؛ title = & quot ؛ (.*؟) & quot ؛ & gt ؛ & lt ؛ img alt = & quot ؛ (.*؟) & quot ؛ src = & quot ؛ (.*؟) & quot ؛ [\ s*] width = & quot ؛ 150 & quot ؛ [\ s*] height = & quot ؛ (.*؟) & quot ؛ & gt ؛ $ Image = $ ImageMatch [4] ؛

يستخرج هذا الكود سمة SRC الخاصة بالصورة من HTML Markup. ومع ذلك ، فإنه يفشل في التعامل مع الحالات التي لا يوجد فيها مسافة بيضاء بين سمات معينة ، مثل:

& lt ؛ a href = & quot ؛/wiki/file: sky1.png & quot ؛ title = & quot ؛ file: sky1.png & quot ؛ & gt ؛ & lt ؛ img alt = & quot ؛ sky1.png & quot ؛ src = & quot ؛ http: //media-mcw.cursecdn.com/thumb/5/56/sky1.png/150px-sky1.png&quot ؛ width = & quot ؛ 150 & quot ؛ الارتفاع = & quot ؛ 84 & quot ؛ & gt ؛ & lt ؛/a & gt ؛ title = & quot ؛ file: tallgrass.gif & quot ؛ & gt ؛ & lt ؛ img alt = & quot ؛ tallgrass.gif & quot ؛ src = & quot ؛ http: //media-mcw.cursecdn.com/3/34/tallgrass.gif&quot ؛ العرض = & quot ؛ 150 & quot ؛ height = & quot ؛ 150 & quot ؛ & gt ؛ & lt ؛/a & gt ؛
# Get Image data
preg_match('#<a href="(.*?)" title="(.*?)"><img alt="(.*?)" src="(.*?)"[\s*]width="150"[\s*]height="(.*?)"></a>#', $data, $imagematch);
$image = $imagematch[4];
لمعالجة هذه المشكلة ، يمكننا استخدام regex اختياري للمساحة البيضاء. هذا يسمح لنا بتجاهل المساحات بين الشخصيات. إليكم كيف:

#& lt ؛ a href \ s؟ = & quot ؛ (.*؟) & quot ؛ العنوان \ s؟ = & quot ؛ (.*؟) "& gt ؛ & lt ؛ img alt \ s؟ = & quot ؛ (.*؟) & quot ؛ src \ s؟ = & quot ؛ (.*؟) & quot ؛ [\ s*] عرض \ s؟ = & quot ؛ 150 & quot ؛ [\ s*] الارتفاع \ s؟ = & quot ؛ (.*؟) "& gt ؛ & lt ؛ قبل = يعني أن المساحة مسموح بها ولكن اختياري.
بيان الافراج يتم استنساخ هذه المقالة في: 1729729039 إذا كان هناك أي انتهاك ، فيرجى الاتصال بـ [email protected] لحذفه.
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3