Как захватывать многострочные текстовые блоки с помощью регулярных выражений?

титульная страница > программирование > Как захватывать многострочные текстовые блоки с помощью регулярных выражений?

Как захватывать многострочные текстовые блоки с помощью регулярных выражений?

Опубликовано 3 ноября 2024 г.

Просматривать:297

How to Capture Multiline Text Blocks with Regular Expressions?

Регулярное выражение для сопоставления многострочных текстовых блоков

Сопоставление текста, занимающего несколько строк, может создать проблемы при построении регулярных выражений. Рассмотрим следующий пример текста:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times)

Цель состоит в том, чтобы захватить два компонента: часть «некоторый изменяющийся ТЕКСТ» и все последующие строки текста в верхнем регистре, за исключением пустой строки.

Неправильные подходы:

Некоторые неправильные подходы к решению этой проблемы включают в себя:

Использование привязок ^ и $ для соответствия переводам строк. В многострочном режиме ^ соответствует позициям после новой строки, а $ соответствует позициям, предшествующим новой строке.
Использование модификатора DOTALL для сопоставления всего, что не является необходимым, поскольку точка (.) соответствует всему, кроме новой строки.

Решение:

Следующее регулярное выражение правильно фиксирует нужные компоненты:

^(. )\n((?:\n. ) )

Вот разбивка его компонентов:

^ соответствует началу строки.
(. ) фиксирует часть «некоторый изменяющийся ТЕКСТ» в группе 1.
\n соответствует символу новой строки.
((?:\n. ) ) захватывает все последующие строки текста в верхнем регистре в группу 2. Конструкция группы без захвата ?: предотвращает попадание этих строк захватываются как отдельные группы.
Оператор повторения гарантирует наличие хотя бы одной строки текста в верхнем регистре.

Использование:

Чтобы использовать это регулярное выражение в Python, вы можете использовать следующий код:

import re

pattern = re.compile(r"^(. )\n((?:\n. ) )", re.MULTILINE)

Затем вы можете использовать метод match() для поиска совпадений в строке :

match = pattern.match(text)
if match:
    text1 = match.group(1)
    text2 = match.group(2)

Последний учебник Более>

Как создать динамические переменные в Python?
динамическое создание переменной в Python способность создавать переменные динамически может быть мощным инструментом, особенно при работе со ...

программирование Опубликовано в 2025-04-28
Причины и решения для сбоя обнаружения лица: ошибка -215
обработка ошибок: разрешение «ошибка: (-215)! Empty () в функции DetectMultiscale" в OpenCV при попытке использовать метод DeTectMultisca...

программирование Опубликовано в 2025-04-28
$Как разрешить ошибку \ "Неверное использование групповой функции \" в MySQL при поиске максимального подсчета?$
Как разрешить ошибку \ "Неверное использование групповой функции \" в MySQL при поиске максимального подсчета?
Как получить максимальный счет, используя MySQL В MySQL вы можете столкнуться с проблемой, пытаясь найти максимальный подсчет значений, сгрупп...

программирование Опубликовано в 2025-04-28
Почему Microsoft Visual C ++ не может правильно реализовать двухфазной экземпляры?
загадка «Сломанная» двухфазное матричное экземпляры в Microsoft Visual C Задача: пользователи обычно выражают обеспокоенность Microsoft Visu...

программирование Опубликовано в 2025-04-28
Как вы можете использовать группу по поводу данных в MySQL?
pivoting Query Results с использованием группы MySQL by В реляционной базе данных, поворот данных относится к перегруппированию строк и столбц...

программирование Опубликовано в 2025-04-28
Как преобразовать столбец DataFrame Pandas в формат DateTime и фильтр по дате?
Transform Pandas DataFrame в Format DateTime сценарий: данные в данных Pandas DataFrame часто существует в различных форматах, включая строк...

программирование Опубликовано в 2025-04-28
Причины CodeIgniter подключиться к базе данных MySQL после перехода на MySQLI
невозможно подключиться к базе данных MySQL: Сообщение об ошибке устранения неисправностей При попытке переключиться с драйвера MySQL к вашему...

программирование Опубликовано в 2025-04-28
Почему Java не может создать общие массивы?
enderic Mrue Creation Error Вопрос: ] при попытке создать массив общих классов, используя выражение: ArrayList [2]; public static ArrayLi...

программирование Опубликовано в 2025-04-28
Как Android отправляет данные POST на PHP Server?
Отправка данных в Android введение Эта статья рассматривает необходимость отправки данных в сценарий PHP и отобразить результат в приложен...

программирование Опубликовано в 2025-04-28
$Какой метод более эффективен для обнаружения с точки зрения полигона: трассировка лучей или matplotlib \ path.contains_points?$
Какой метод более эффективен для обнаружения с точки зрения полигона: трассировка лучей или matplotlib \ path.contains_points?
эффективное обнаружение с пунктом-в полигоне в Python определение того, находится ли точка в полигоне частой задачей в вычислительной геометрии....

программирование Опубликовано в 2025-04-28
Как получить фактический визуализированный шрифт в JavaScript, когда атрибут шрифта CSS не определен?
доступ к фактическому визуализации, когда он не определен в CSS при доступе к свойствам шрифта элемента, javascript object.Style.fontfamily и ...

программирование Опубликовано в 2025-04-28
Python эффективный способ удаления HTML -тегов из текста
Learing HTML -теги в Python для нетронутого текстового представления манипулирование ответами HTML часто включает в себя извлечение соответств...

программирование Опубликовано в 2025-04-28
Как снять анонимные обработчики событий JavaScript чисто?
] удаление слушателей анонимных событий добавление слушателей анонимных событий в элементы обеспечивают гибкость и простоту, но когда пришло врем...

программирование Опубликовано в 2025-04-28
Решить ошибку MySQL 1153: Пакет превышает лимит MAX_ALLYED_PACKET '
mysql Ошибка 1153: Устранение неполадок Давайте углубимся в виновника и исследуем решения для исправления этой проблемы. понимание ошибки Э...

программирование Опубликовано в 2025-04-28
Ошибка компилятора "usr/bin/ld: не может найти -l" Решение
isrysed: "usr/bin/ld: нельзя найти -l " Эта ошибка указывает, что линкера не может найти указанную библиотеку при связывании вашего...

программирование Опубликовано в 2025-04-28