正規表現を使用して複数行のテキスト ブロックをキャプチャするにはどうすればよいですか?

表紙 > プログラミング > 正規表現を使用して複数行のテキストブロックをキャプチャするにはどうすればよいですか?

正規表現を使用して複数行のテキストブロックをキャプチャするにはどうすればよいですか?

2024 年 11 月 3 日に公開

ブラウズ：476

How to Capture Multiline Text Blocks with Regular Expressions?

複数行のテキストブロックを一致させるための正規表現

複数行にまたがるテキストを一致させると、正規表現の構築に課題が生じる可能性があります。次のテキスト例を考えてみましょう:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times)

目標は、2 つのコンポーネントをキャプチャすることです。「一部の可変テキスト」部分と、空の行を除く後続の大文字テキストのすべての行です。

間違ったアプローチ:

この問題を解決するための間違ったアプローチには次のものがあります:

改行を一致させるために ^ アンカーと $ アンカーを使用する。複数行モードでは、^ は改行に続く位置に一致し、$ は改行に先行する位置に一致します。
DOTALL 修飾子を使用してすべてに一致しますが、ドット (.) は改行以外のすべてに一致するため、これは不要です。

解決策:

次の正規表現は、目的のコンポーネントを正しく取得します:

^(. )\n((?:\n. ) )

コンポーネントの内訳は次のとおりです。

^ は行の先頭と一致します。
(. ) は「一部の可変テキスト」部分をグループ 1 にキャプチャします。
\n は改行文字に一致します。
((?:\n. ) ) は、後続の大文字テキストのすべての行をグループ 2 にキャプチャします。 ?: 非キャプチャグループ構造により、これらの行が
繰り返し演算子により、少なくとも 1 行の大文字テキストが存在することが保証されます。

使用法:

Python でこの正規表現を使用するには、次のコードを使用できます:

import re

pattern = re.compile(r"^(. )\n((?:\n. ) )", re.MULTILINE)

その後、match() メソッドを使用して文字列内の一致を見つけることができます:

match = pattern.match(text)
if match:
    text1 = match.group(1)
    text2 = match.group(2)

最新のチュートリアルもっと>

ChatBotコマンドの実行のためにリアルタイムでstdoutをキャプチャしてストリーミングする方法は？
コマンド実行からリアルタイムでstdoutをキャプチャする再起動のライン（コマンド）： print（line）このコードでは、subprocess.popen（）関数を使用して指定されたコマンドを実行します。 stdoutパラメーターは、subprocess....

プログラミング 2025-04-03に投稿されました
CSSを使用してChromeとFirefoxのコンソール出力を着色できますか？
javaScriptコンソールの色の表示は、クロムのコンソールを使用してエラー用の赤、警告用のオレンジ、コンソール用グリーンなどの色のテキストを表示することは可能です。メッセージ？回答はい、CSSを使用して、ChromeとFirefox（バージョン31以降）のコンソールに表示さ...

プログラミング 2025-04-03に投稿されました
オブジェクトフィット：IEとEdgeでカバーが失敗します、修正方法は？
object-fit：カバーがIEとEDGEで失敗します。 CSSでは、一貫した画像の高さを維持するために、ブラウザ全体でシームレスに動作します。ただし、IEとEdgeでは、独特の問題が発生します。ブラウザをスケーリングすると、画像は高さをズームするのではなく幅でサイズを変更し、外観を歪め...

プログラミング 2025-04-03に投稿されました
交換指令を使用して、GO modのモジュールパスの不一致を解決する方法は？
go mod のモジュールパスの不一致を克服するgo modを利用する場合、輸入パッケージと実際の輸入パスの間のパスミスマッチとのパスミスマッチで、第三者パッケージが別のパッケージをインポートする紛争に遭遇する可能性があります。エコーされたメッセージで示されているように、これはGo M...

プログラミング 2025-04-03に投稿されました
Javaのフルスクリーン専用モードでユーザー入力を処理する方法は？
ハンドリングユーザー入力は、java intuling in full screenの排他的モードでのフルスクリーンの排他的モードでのハンドリングを排他的モードで実行するとき、通常のイベント処理メカニズムは予想されるように機能しない場合があります。この記事では、このモードでキーボード...

プログラミング 2025-04-03に投稿されました
Node-MYSQLを使用して単一のクエリで複数のSQLステートメントを実行するにはどうすればよいですか？
node-mysql in node.jsでのマルチステートメントクエリサポート、ノード-Mysqlパッケージを使用してnode-mysqlを使用してnode-mysqlを使用して、1つのクエリを使用してnode-mysqlの記録を使用して、1つのクエリで複数のsqlステートメントを...

プログラミング 2025-04-03に投稿されました
なぜ私の線形勾配の背景にストライプがあるのか、どうすればそれらを修正できますか？
リニアグラデーションからの背景ストライプを追放する背景に線形勾配プロパティを使用する場合、方向が上または下に設定されているときに顕著なストライプに遭遇する場合があります。これらの見苦しいアーティファクトは、複雑なバックグラウンド伝播現象に起因する可能性があります。その後、線形勾配はこの高...

プログラミング 2025-04-03に投稿されました
$PHP \の機能の再定義制限を克服する方法は？$
PHP \の機能の再定義制限を克服する方法は？
PHPの関数の再定義制限をPHPで克服することは、同じ名前の関数を複数回定義することはノーではありません。提供されたコードスニペットで見られるように、そうすることは、恐ろしい「再び削除できない」エラーになります。 $ b）{ $ a * $ b; } を返しますが、PHPツールベ...

プログラミング 2025-04-03に投稿されました
$ポイントインポリゴン検出により効率的な方法：Ray TracingまたはMatplotlib \ 's path.contains_points？$
ポイントインポリゴン検出により効率的な方法：Ray TracingまたはMatplotlib \ 's path.contains_points？
Pythonの効率的なポイントインポリゴン検出ポリゴン内にあるかどうかを決定することは、計算ジオメトリの頻繁なタスクです。このタスクの効率的な方法を見つけることは、多数のポイントを評価する場合に有利です。ここでは、一般的に使用される2つの方法を調査して比較します：Ray TracingとM...

プログラミング 2025-04-03に投稿されました
「JSON」パッケージを使用してGOでJSONアレイを解析する方法は？
json arrays in jsonパッケージ問題：次のGOコードを検討してください：タイプjsontype struct { 配列[]文字列 } func main（）{ datajson：= `[" 1 "、" 2 "...

プログラミング 2025-04-03に投稿されました
JavaScriptで複数の変数を宣言する方法はより保守可能ですか？
javascriptの複数の変数を宣言する：2つの方法を調査する javascriptでは、開発者はしばしば複数の変数を宣言する必要性に遭遇します。これの2つの一般的なアプローチは次のとおりです。 var variable2 = "Testing ..."; var...

プログラミング 2025-04-03に投稿されました
PHPのUnicode文字列からURLに優しいナメクジを効率的に生成するにはどうすればよいですか？
効率的なナメクジ生成のための関数を作成するスラッグの作成、URLで使用されるユニコード文字列の単純化された表現は挑戦的な作業になります。この記事では、スラッグを効率的に生成し、特殊文字と非ASCII文字をURLに優しい形式に変換するための簡潔なソリューションを紹介します。一連の操作を使用...

プログラミング 2025-04-03に投稿されました
なぜ有効なコードにもかかわらず、PHPで入力をキャプチャするリクエストを要求するのはなぜですか？
アドレス指定Php action='' を使用して、フォームの提出後に$ _POSTアレイの内容を確認します。適切に： if（empty（$ _ server ['content_type']）） { $ _Server ['content_typ...

プログラミング 2025-04-03に投稿されました
$\ "while（1）vs。for（;;）：コンパイラの最適化はパフォーマンスの違いを排除しますか？\"$
\ "while（1）vs。for（;;）：コンパイラの最適化はパフォーマンスの違いを排除しますか？\"
while（1）vs。for（;;）：速度の違いはありますか？ loops？回答：では、ほとんどの最新のコンパイラでは、（1）と（;;）。コンパイラー： perl：の両方が（1）と（;;）が同じオプコードをもたらします。 1 入力 - > 2を入力します 2 NextSt...

プログラミング 2025-04-03に投稿されました
オブジェクトがPythonに特定の属性を持っているかどうかを確認する方法は？
メソッドオブジェクト属性の存在を決定するメソッドこの問い合わせは、オブジェクト内の特定の属性の存在を検証する方法を求めています。未定義のプロパティにアクセスしようとする試みがエラーを提起する次の例を考えてみましょう： >>> a = SomeClass() >&g...

プログラミング 2025-04-03に投稿されました