Python で正規表現を使用して複数行のブロックを照合する方法

表紙 > プログラミング > Python で正規表現を使用して複数行のブロックを照合する方法

Python で正規表現を使用して複数行のブロックを照合する方法

2024 年 11 月 4 日に公開

ブラウズ：200

How to Match Multiline Blocks in Python Using Regular Expressions?

正規表現を使用した複数行ブロックのマッチング

Python の正規表現を使用して複数行にまたがるテキストとマッチングするときに問題が発生する可能性があります。次のテキスト例を考えてみましょう:

some Varying TEXT

DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF
[more of the above, ending with a newline]
[yep, there is a variable number of lines here]

(repeat the above a few hundred times).

目標は 2 つのコンポーネントをキャプチャすることです:

"some Varying TEXT"
すべての大文字の行は 2 行に配置されていますその下 (改行文字を除く)

いくつかのアプローチが失敗しました:

re.compile(r"^>(\w )$$(\n[.$] )^$", re.MULTILINE) # Capture both parts
re.compile(r"([^>][\w\s] )$", re.MULTILINE|re.DOTALL) # Just textlines

この問題に対処するには、次の正規表現を利用します。

re.compile(r"^(. )\n((?:\n. ) )", re.MULTILINE)

アンカー "^" と「$」は改行と一致しません。したがって、複数行モードでは、"^" が改行の後に続き、"$" が改行の前に置かれます。

さらに、さまざまな改行形式に注意してください。改行、復帰、またはその両方が含まれる可能性のあるテキストの場合は、より包括的な正規表現:

re.compile(r"^(. )(?:\n|\r\n?)((?:(?:\n|\r\n?). ) )", re.MULTILINE)

ドットによってすでに改行が除外されているため、ここでは DOTALL 修飾子は不要です。

最新のチュートリアルもっと>

なぜ私のCSSの背景画像が現れるのですか？
トラブルシューティング：css背景画像が表示されないチュートリアルの指示にもかかわらず、背景画像が読み込まれない問題に遭遇しました。画像とスタイルのシートは同じディレクトリに存在していますが、背景は空白の白いキャンバスのままです。画像ファイル名を囲む引用： background-ima...

プログラミング 2025-07-09に投稿しました
McRyptからOpenSSLに暗号化を移行し、OpenSSLを使用してMcRyptで暗号化されたデータを復号化できますか？
暗号化ライブラリをMcRyptからOpenSSL にアップグレードして、暗号化ライブラリをMcRyptからOpenSLにアップグレードできますか？ OpenSSLでは、McRyptで暗号化されたデータを復号化することは可能ですか？ 2つの異なる投稿は矛盾する情報を提供します。もしそうなら...

プログラミング 2025-07-09に投稿しました
なぜLambdaの式には、Javaの「最終」または「有効な最終」変数が必要なのですか？
lambda式には、「最終」または「効果的に最終」変数「エラーメッセージ」「ラムダ式で使用される変数は、最終または効果的に最終的に」を示すことを示すラムダ式または最終的な領域で使用される可能性があることを示すことが示されます。 final。 //コードがありません ca...

プログラミング 2025-07-09に投稿しました
Pandas DataFrame列を日付ごとにDateTime形式とフィルターに変換する方法は？
パンダのデータフレーム列をdatetime形式に変換シナリオ：データは、ストリングを含むさまざまな形式でしばしば存在します。時間データを操作する場合、タイムスタンプは最初は文字列として表示されますが、正確な分析のためにデータタイム形式に変換する必要があります。この関数は、文字列列の予想...

プログラミング 2025-07-09に投稿しました
Javaのオブザーバーパターンを使用してカスタムイベントを実装する方法は？
Javaでカスタムイベントを作成するカスタムイベントは、多くのプログラミングシナリオで不可欠であり、特定のトリガーに基づいてコンポーネントが相互に通信できるようにします。この記事は、以下に対処することを目的としています。オブザーバーパターンの概要を次に示します。サンプル実装次の...

プログラミング 2025-07-09に投稿しました
複数のユーザータイプ（学生、教師、および管理者）をFireBaseアプリでそれぞれのアクティビティにリダイレクトする方法は？
red：複数のユーザータイプをそれぞれのアクティビティにリダイレクトする方法ログイン。現在のコードは、2つのユーザータイプのリダイレクトを正常に管理しますが、3番目のタイプ（admin）を組み込もうとするときに課題に直面します。元のスキーマは、2種類のユーザーのみに対応していました。 3...

プログラミング 2025-07-09に投稿しました
CSSは言語分析を強く入力しました
プログラミング言語を分類する方法の1つは、それがどれほど強くまたは弱く入力されているかによってです。ここで、「タイプされた」とは、変数がコンパイル時に既知の場合を意味します。これの例は、整数（1）が整数（ "1"）を含む文字列に追加されるシナリオです： result = 1 ...

プログラミング 2025-07-09に投稿しました
$PHP \の機能の再定義制限を克服する方法は？$
PHP \の機能の再定義制限を克服する方法は？
PHPの関数の再定義制限をPHPで克服することは、同じ名前の関数を複数回定義することはノーではありません。提供されたコードスニペットで見られるように、そうすることは、恐ろしい「再び削除できない」エラーになります。 $ b）{ $ a * $ b; } を返しますが、PHPツールベ...

プログラミング 2025-07-09に投稿しました
Javaの「DD/MM/YYYY HH：MM：SS.SS」形式で現在の日付と時刻を正しく表示するにはどうすればよいですか？
「DD/mm/yyyy HH：mm：ss.ss」形式で現在の日付と時刻を表示する方法。異なるフォーマットパターンを持つさまざまなSimpleDateFormatインスタンスの使用にあります。 java.text.simpledateformat; java.util.calendarをインポ...

プログラミング 2025-07-09に投稿しました
バージョン5.6.5の前にMySQLのタイムスタンプ列を使用してcurrent_timestampを使用することの制限は何でしたか？
の制限current_timestampがデフォルトまたは5.6.5より前のmysqlバージョンのcurrent_timestampの更新条項の制限は歴史的に、5.6.5以前のmysqlバージョンでは、デフォルトの列のみを制限しました。 current_timestamp句。この制限は、20...

プログラミング 2025-07-09に投稿しました
`console.log`は、変更されたオブジェクト値の例外の理由を示しています
objects and console.log：Objects and offeried を操作する場合、奇妙なことは独特の行動に遭遇する場合があります。このコードスニペットを分析することにより、この謎を解明しましょう： foo = [{id：1}、{id：2}、{id：3}、{id：...

プログラミング 2025-07-09に投稿しました
MySQLデータベースメソッドは、同じインスタンスをダンプする必要はありません
同じインスタンスでmysqlデータベースをコピーする同じmysqlインスタンスでデータベースをコピーすることはできません。以下の方法は、従来のダンプアンドインポートプロセスのより簡単な代替手段を提供します。 | mysql new_db_name このコマンドは、new_db_nam...

プログラミング 2025-07-09に投稿しました
Pythonの理解を使用して辞書を効率的に作成するにはどうすればよいですか？
python辞書の理解 Pythonでは、辞書の概念は新しい辞書を生成するための簡潔な方法を提供します。それらはリストの概念に似ていますが、いくつかの顕著な違いがあります。キーと値を明示的に指定する必要があります。たとえば、 d = {n：n ** 2の範囲（5）} これは、0から4の...

プログラミング 2025-07-09に投稿しました
Javaが一般的な配列を作成できないのはなぜですか？
generic array作成エラー質問： ; public static ArrayList<myObject>[] a = new ArrayList<myObject>[2];

プログラミング 2025-07-09に投稿しました
なぜ `body {margin：0; } `常にCSSの上限を削除しますか？
css の扱います。多くの場合、「ボディ{マージン：0;}」などの提供されたコードは、目的の結果を生成しません。これは、コンテンツの親要素が正のパディング値を持っている場合に発生する可能性があります。特定のマージンの問題に対処することをお勧めします。親要素にパディングがある場合、それを...

プログラミング 2025-07-09に投稿しました