如何使用正規表示式捕獲多行文字區塊？

首頁 > 程式設計 > 如何使用正規表示式捕獲多行文字區塊？

如何使用正規表示式捕獲多行文字區塊？

發佈於2024-11-03

How to Capture Multiline Text Blocks with Regular Expressions?

符合多行文字區塊的正規表示式

符合跨多行的文字可能會為正規表示式建構帶來挑戰。考慮以下範例文本：

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times)

目標是捕捉兩個組成部分：「some Varying TEXT」部分和所有後續大寫文字行，不包括空白行。

不正確的方法：

解決此問題的一些不正確的方法包括：

使用^ 和$ 錨點來匹配換行符。在多行模式下，^ 匹配換行符後面的位置，$ 匹配換行符之前的位置。
使用 DOTALL 修飾符來匹配所有內容，這是不必要的，因為點 (.) 匹配除換行符之外的所有內容。

解：

以下正規表示式正確捕捉所需的元件：

^(. )\n((?:\n. ) )

下面是其組成部分的細分：

^ 匹配行的開頭。
(. ) 將「some Varying TEXT」部分捕獲到組 1 中。
\n 符合換行符號。
((?:\n. ) ) 將大寫文字的所有後續行擷取到組 2 中。 ?: 非捕獲組構造可防止這些行被捕獲為單獨的組。
重複運算子確保至少存在一行大寫文字。

用法：

用法：

import re

pattern = re.compile(r"^(. )\n((?:\n. ) )", re.MULTILINE)

要在Python中使用這個正規表示式，可以使用以下程式碼：

match = pattern.match(text)
if match:
    text1 = match.group(1)
    text2 = match.group(2)

然後您可以使用match() 方法在字串中尋找符合項:

How to Capture Multiline Text Blocks with Regular Expressions?

match = 模式.match(文本) 如果匹配： text1 = match.group(1) text2 = match.group(2)

最新教學更多>

為什麼PYTZ最初顯示出意外的時區偏移？
與pytz 最初從pytz獲得特定的偏移。例如，亞洲/hong_kong最初顯示一個七個小時37分鐘的偏移：差異源利用本地化將時區分配給日期，使用了適當的時區名稱和偏移量。但是，直接使用DateTime構造器分配時區不允許進行正確的調整。 example pytz.timezone（&#...

程式設計發佈於2025-04-29
如何有效地轉換PHP中的時區？
在PHP 利用dateTime對象和functions DateTime對象及其相應的功能別名為時區轉換提供方便的方法。例如： //定義用戶的時區 date_default_timezone_set（'歐洲/倫敦'）; //創建DateTime對象 $ dateTime = ne...

程式設計發佈於2025-04-29
如何在其容器中為DIV創建平滑的左右CSS動畫？
通用CSS動畫，用於左右運動，我們將探索創建一個通用的CSS動畫，以向左和右移動DIV，從而到達其容器的邊緣。該動畫可以應用於具有絕對定位的任何div，無論其未知長度如何。問題：使用左直接導致瞬時消失更加流暢的解決方案：混合轉換和左 [並實現平穩的，線性的運動，我們介紹了線性的轉換。...

程式設計發佈於2025-04-29
如何實時捕獲和流媒體以進行聊天機器人命令執行？
在開發能夠執行命令的chatbots的領域中，實時從命令執行實時捕獲Stdout，一個常見的需求是能夠檢索和顯示標準輸出（stdout）在cath cath cant cant cant cant cant cant cant cant interfaces in Chate cant inter...

程式設計發佈於2025-04-29
在GO中構造SQL查詢時，如何安全地加入文本和值？
在go中構造文本sql查詢時，在go sql queries 中，在使用conting and contement和contement consem per時，尤其是在使用integer per當per當per時，per per per當per. [&&&&&&&&&&&&&&&&默元組方法在...

程式設計發佈於2025-04-29
在UTF8 MySQL表中正確將Latin1字符轉換為UTF8的方法
在UTF8表中將latin1字符轉換為utf8 ，您遇到了一個問題，其中含義的字符（例如，“jáuòiñe”）在utf8 table tabled tablesset中被extect（例如，“致電。為了解決此問題，您正在嘗試使用“ mb_convert_encoding”和“ iconv”轉換受...

程式設計發佈於2025-04-29
$在Ubuntu/linux上安裝mysql-python時，如何修復\“ mysql_config \”錯誤？$
在Ubuntu/linux上安裝mysql-python時，如何修復\“ mysql_config \”錯誤？
mysql-python安裝錯誤：“ mysql_config找不到”“ 由於缺少MySQL開發庫而出現此錯誤。解決此問題，建議在Ubuntu上使用該分發的存儲庫。使用以下命令安裝Python-MysqldB： sudo apt-get安裝python-mysqldb sudo pip in...

程式設計發佈於2025-04-29
如何將多種用戶類型（學生，老師和管理員）重定向到Firebase應用中的各自活動？
Red: How to Redirect Multiple User Types to Respective ActivitiesUnderstanding the ProblemIn a Firebase-based voting app with three distinct user type...

程式設計發佈於2025-04-29
如何克服PHP的功能重新定義限制？
克服PHP的函數重新定義限制在PHP中，多次定義一個相同名稱的函數是一個no-no。嘗試這樣做，如提供的代碼段所示，將導致可怕的“不能重新列出”錯誤。但是，PHP工具腰帶中有一個隱藏的寶石：runkit擴展。它使您能夠靈活地重新定義函數。 runkit_function_renction_...

程式設計發佈於2025-04-29
編譯器報錯“usr/bin/ld: cannot find -l”解決方法
錯誤：“ usr/bin/ld：找不到-l “ 此錯誤表明鏈接器在鏈接您的可執行文件時無法找到指定的庫。為了解決此問題，我們將深入研究如何指定庫路徑並將鏈接引導到正確位置的詳細信息。添加庫搜索路徑的一個可能的原因是，此錯誤是您的makefile中缺少庫搜索路徑。要解決它，您可以在鏈接器命令中添...

程式設計發佈於2025-04-29
如何同步迭代並從PHP中的兩個等級陣列打印值？
同步的迭代和打印值來自相同大小的兩個數組使用兩個數組相等大小的selectbox時，一個包含country代碼的數組，另一個包含鄉村代碼，另一個包含其相應名稱的數組，可能會因不當提供了exply for for for the uncore for the forsion for for ytry...

程式設計發佈於2025-04-29
PHP SimpleXML解析帶命名空間冒號的XML方法
在php 很少，請使用該限制很大，很少有很高。例如：這種技術可確保可以通過遍歷XML樹和使用兒童（）方法（）方法的XML樹和切換名稱空間來訪問名稱空間內的元素。

程式設計發佈於2025-04-29
為什麼Microsoft Visual C ++無法正確實現兩台模板的實例？
The Mystery of "Broken" Two-Phase Template Instantiation in Microsoft Visual C Problem Statement:Users commonly express concerns that Micro...

程式設計發佈於2025-04-29
將圖片浮動到底部右側並環繞文字的技巧
在Web設計中圍繞在Web設計中，有時可以將圖像浮動到頁面右下角，從而使文本圍繞它纏繞。這可以在有效地展示圖像的同時創建一個吸引人的視覺效果。 css位置在右下角，使用css float and clear properties： img { 浮點：對； ...

程式設計發佈於2025-04-29
為什麼我在Silverlight Linq查詢中獲得“無法找到查詢模式的實現”錯誤？
查詢模式實現缺失：解決“無法找到”錯誤在Silverlight應用程序中，嘗試使用LINQ建立LINQ連接以錯誤而實現的數據庫”，無法找到查詢模式的實現。”當省略LINQ名稱空間或查詢類型缺少IEnumerable 實現時，通常會發生此錯誤。解決問題來驗證該類型的質量是至關重要的。在此特定實例...

程式設計發佈於2025-04-29