Регулярное выражение для сопоставления многострочных текстовых блоков
Сопоставление текста, занимающего несколько строк, может создать проблемы при построении регулярных выражений. Рассмотрим следующий пример текста:
some Varying TEXT DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF [more of the above, ending with a newline] [yep, there is a variable number of lines here] (repeat the above a few hundred times)
Цель состоит в том, чтобы захватить два компонента: часть «некоторый изменяющийся ТЕКСТ» и все последующие строки текста в верхнем регистре, за исключением пустой строки.
Неправильные подходы:
Некоторые неправильные подходы к решению этой проблемы включают в себя:
Решение:
Следующее регулярное выражение правильно фиксирует нужные компоненты:
^(. )\n((?:\n. ) )
Вот разбивка его компонентов:
Использование:
Чтобы использовать это регулярное выражение в Python, вы можете использовать следующий код:
import re
pattern = re.compile(r"^(. )\n((?:\n. ) )", re.MULTILINE)
Затем вы можете использовать метод match() для поиска совпадений в строке :
match = pattern.match(text)
if match:
text1 = match.group(1)
text2 = match.group(2)
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3