"إذا أراد العامل أن يؤدي عمله بشكل جيد، فعليه أولاً أن يشحذ أدواته." - كونفوشيوس، "مختارات كونفوشيوس. لو لينجونج"
الصفحة الأمامية > برمجة > كيفية التقاط كتل نصية متعددة الأسطر باستخدام التعبيرات العادية؟

كيفية التقاط كتل نصية متعددة الأسطر باستخدام التعبيرات العادية؟

تم النشر بتاريخ 2024-11-03
تصفح:382

How to Capture Multiline Text Blocks with Regular Expressions?

التعبير العادي لمطابقة كتل النص متعددة الأسطر

يمكن أن تشكل مطابقة النص الذي يمتد على عدة أسطر تحديات في إنشاء التعبير العادي. خذ بعين الاعتبار النص النموذجي التالي:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times)

الهدف هو التقاط مكونين: جزء "بعض النصوص المتغيرة" وجميع الأسطر اللاحقة من النص الكبير، باستثناء السطر الفارغ.

] &&&] الأساليب غير الصحيحة:

تتضمن بعض الأساليب غير الصحيحة لحل هذه المشكلة ما يلي:

    استخدام نقاط الربط ^ و $ لمطابقة خلاصات الأسطر. في وضع الأسطر المتعددة، ^ يطابق المواضع التي تلي الأسطر الجديدة ويطابق $ المواضع التي تسبق الأسطر الجديدة.
  • استخدام معدل DOTALL لمطابقة كل شيء، وهو أمر غير ضروري لأن النقطة (.) تطابق كل شيء باستثناء الأسطر الجديدة.

الحل:

يلتقط التعبير العادي التالي المكونات المطلوبة بشكل صحيح:

^(. )\n((?:\n. ) )
^(. )\n((?:\n. ) )
إليك تفاصيل مكوناته:

    ^ يطابق بداية السطر.
  • (. ) يلتقط الجزء "بعض النص المتغير" في المجموعة 1.
  • \n يتطابق مع حرف السطر الجديد.
  • ((?:\n. ) ) يلتقط كافة الأسطر اللاحقة من النص الكبير في المجموعة 2. يمنع بناء المجموعة ?: غير الملتقط هذه الأسطر من يتم التقاطها كمجموعات فردية.
  • يضمن مشغل التكرار وجود سطر واحد على الأقل من النص الكبير.

الاستخدام:

لاستخدام هذا التعبير العادي في بايثون، يمكنك استخدام الكود التالي:

import re

pattern = re.compile(r"^(. )\n((?:\n. ) )", re.MULTILINE)
يمكنك بعد ذلك استخدام طريقة match() للعثور على التطابقات في سلسلة :

match = Pattern.match(text)
إذا المباراة:
    text1 = match.group(1)
    text2 = match.group(2)
أحدث البرنامج التعليمي أكثر>

تنصل: جميع الموارد المقدمة هي جزئيًا من الإنترنت. إذا كان هناك أي انتهاك لحقوق الطبع والنشر الخاصة بك أو الحقوق والمصالح الأخرى، فيرجى توضيح الأسباب التفصيلية وتقديم دليل على حقوق الطبع والنشر أو الحقوق والمصالح ثم إرسالها إلى البريد الإلكتروني: [email protected]. سوف نتعامل مع الأمر لك في أقرب وقت ممكن.

Copyright© 2022 湘ICP备2022001581号-3