Go Regex \\b Boundary がラテン文字で失敗するのはなぜですか?

表紙 > プログラミング > Go Regex \\b Boundary がラテン文字で失敗するのはなぜですか?

Go Regex \\b Boundary がラテン文字で失敗するのはなぜですか?

2024 年 11 月 8 日に公開

ブラウズ：673

$Why Does Go Regex \b Boundary Fail with Latin Characters?$

\b Go 正規表現におけるラテン文字の境界

Go 正規表現の世界では、\b 境界オプションには少し癖があります。ラテン文字を扱う場合。この問題は、アクセント付き母音や特殊文字などのラテン文字を含む単語を定義しようとするときに発生します。

次の例を考えてみましょう。\b 境界オプションを使用して単語 "vis" と一致させたいとします。

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`\b(vis)\b`)
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}

驚くべきことに、「révisé」を false として一致させるという予期した結果は発生しません。代わりに、true として一致します。これは、\b が ASCII 単語境界でのみ機能するためです。

この問題を解決してラテン文字と正確に一致させるには、\b 境界をより包括的な代替物に置き換えることができます。以下に例を示します:

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`)
    fmt.Println(r.MatchString("vis"))
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}

この変更により、正規表現は文字列の先頭 (\A)、文字列の末尾 (\z)、および空白 (\s) の組み合わせを使用して単語の先頭と末尾を認識するようになりました。結果は、「vis」が true で、「révisé」が false と正確に一致します:

true
true
false
false

この手法により、ラテン文字の存在に関係なく、単語の正確な一致が保証されます。

最新のチュートリアルもっと>

Java文字列に複数のサブストリングを効率的に交換するにはどうすればよいですか？
java で複数のサブストリングを弦の複数のサブストリングを置き換えると、文字列内の複数のサブストリングを置き換える必要性に直面すると、弦楽列の方法を繰り返し担当するブルートのアプローチに頼ることに魅力的です。ただし、これは大きな文字列や多数の文字列を使用する場合は非効率的です。正規表...

プログラミング 2025-04-27に投稿されました
なぜPHPのDateTime :: Modify（ '+1 Month'）が予期しない結果を生み出すのですか？
PHP DateTimeで月数の変更：PHPのDateTimeクラスを操作する場合、数か月を追加または減算する場合、意図した動作を発見します。ドキュメントが警告しているように、これらの操作は見た目ほど直感的ではないため、これらの操作に「注意してください」。 $ date-> modify（...

プログラミング 2025-04-27に投稿されました
Pandas DataFrame列を日付ごとにDateTime形式とフィルターに変換する方法は？
パンダのデータフレーム列をdatetime形式に変換シナリオ：データは、ストリングを含むさまざまな形式でしばしば存在します。時間データを操作する場合、タイムスタンプは最初は文字列として表示されますが、正確な分析のためにデータタイム形式に変換する必要があります。この関数は、文字列列の予想...

プログラミング 2025-04-27に投稿されました
HTMLがページ番号やソリューションを印刷できない理由
はhtmlページにページ番号を印刷できません。使用： @page { マージン：10％; @トップセンター{ フォントファミリー：sans-serif; font-weight：bold; font-size：2em; コンテンツ：カウンター（ページ）...

プログラミング 2025-04-27に投稿されました
名前空間コロンを使用したPHP SimplexML解析XMLメソッド
XMLをphp simplexmlは、XMLをコロンと比較するXMLを接続するXMLを接続した場合、XML要素を含むXMLを解析するときに困難に遭遇します。この問題は、simplexmlがデフォルトの名前空間から逸脱するXML構造を処理できないために発生します。例： $ xml ...

プログラミング 2025-04-27に投稿されました
2Dアレイから要素を抽出する方法は？別の配列のインデックスを使用します
を使用して、numpyアレイを別の配列の2番目の次元のインデックスとして使用して 2番目のアレイによって提供されるインデックスに基づいて2Dアレイから特定の要素を抽出します。例： a = np.array（[[0,1]、[2,3]、[4,5]]） B = np.Array（[[1]、[...

プログラミング 2025-04-27に投稿されました
JavaのMap.EntryとSimpleEntryはどのようにキー価値ペア管理を単純化しますか？
valueペアの包括的なコレクション：javaのmap.entry and simpleEntry をJavaで紹介します。 However, for scenarios where maintaining the order of elements is crucial and un...

プログラミング 2025-04-27に投稿されました
入力：なぜ「警告：mysqli_query（）がパラメーター1がmysqliであると予想し、リソースが与えられた「エラーが発生し、それを修正する方法」出力：エラーを解決するための分析と修正「警告：mysqli_query（）パラメーターは、リソースの代わりにmysqliである必要があります」
mysqli_query（）は、パラメーター1がmysqliであることを期待しています。発生する可能性があります。このエラーは、最初のパラメーターのタイプと予想されるリソースタイプとの間の不一致を示します。これらの2つの拡張機能は交換可能ではなく、一緒に使用することはできません。 MySQ...

プログラミング 2025-04-27に投稿されました
JavaScriptオブジェクトのキーをアルファベット順に並べ替える方法は？
javascriptオブジェクトをキーで並べ替える方法JavaScriptオブジェクトがある場合は、読みやすさまたは処理目的の改善のためにそのプロパティをアルファベット順に再編成することができます。これは、次の手順を利用することで実現できます。 const unordered = { ...

プログラミング 2025-04-27に投稿されました
ネストされた機能とPythonの閉鎖の違いは何ですか
ネストされた関数とpython の閉鎖と閉鎖は、表面的に閉鎖に似ている一方で、キー差のために根本的に異なります： [非閉ざされた Pythonのネストされた関数は、以下の要件を満たしていないため閉鎖とは見なされません：は、それらは、エンクルの外側に実行される場合、に実行...

プログラミング 2025-04-27に投稿されました
decimal.parse（）を使用して指数表記で数値を解析する方法は？
指数表記からの数字を解析する場合、decimal.parse（ "1.2345e-02"）を使用して指数表記で表現された文字列を解析しようとすると、エラーが発生します。これは、デフォルトの解析方法が指数表記法を認識しないためです。次の例に示すように、numberSty...

プログラミング 2025-04-27に投稿されました
Pythonで動的変数を作成する方法は？
python の動的変数作成は、特に複雑なデータ構造またはアルゴリズムを操作する場合、動的に変数を作成する能力が強力なツールになります。 Pythonは、これを達成するためのいくつかの創造的な方法を提供します。辞書を使用すると、キーを動的に作成し、対応する値を割り当てることができます。...

プログラミング 2025-04-27に投稿されました
$\ "while（1）vs。for（;;）：コンパイラの最適化はパフォーマンスの違いを排除しますか？\"$
\ "while（1）vs。for（;;）：コンパイラの最適化はパフォーマンスの違いを排除しますか？\"
while（1）vs。for（;;）：速度の違いはありますか？ loops？回答：では、ほとんどの最新のコンパイラでは、（1）と（;;）。コンパイラー： perl：の両方が（1）と（;;）が同じオプコードをもたらします。 1 入力 - > 2を入力します 2 NextSt...

プログラミング 2025-04-27に投稿されました
非同期操作を同時に実行し、JavaScriptでエラーを正しく処理する方法は？
並行操作実行を待つ問題のコードスニペットは非同期操作を実行する際の問題に遭遇します：この実装は、次の操作を開始する前に各操作の完了を順次待ちます。同時実行を有効にするには、修正されたアプローチが必要です。 getValue2async（）; const value1 = awa...

プログラミング 2025-04-27に投稿されました
複数のユーザータイプ（学生、教師、および管理者）をFireBaseアプリでそれぞれのアクティビティにリダイレクトする方法は？
red：複数のユーザータイプをそれぞれのアクティビティにリダイレクトする方法ログイン。現在のコードは、2つのユーザータイプのリダイレクトを正常に管理しますが、3番目のタイプ（admin）を組み込もうとするときに課題に直面します。元のスキーマは、2種類のユーザーのみに対応していました。 3...

プログラミング 2025-04-27に投稿されました