为什么 Go 正则表达式 \\b 边界对于拉丁字符会失败？

首页 > 编程 > 为什么 Go 正则表达式 \\b 边界对于拉丁字符会失败？

为什么 Go 正则表达式 \\b 边界对于拉丁字符会失败？

发布于2024-11-08

$Why Does Go Regex \b Boundary Fail with Latin Characters?$

\b Go 正则表达式中拉丁字符的边界

在 Go 正则表达式的世界中， \b 边界选项有一个轻微的怪癖处理拉丁字符时。当尝试定义包含拉丁字符（例如重音元音和特殊字符）的单词时，就会出现此问题。

考虑以下示例，我们希望使用 \b 边界选项来匹配单词“vis”：

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`\b(vis)\b`)
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}

令人惊讶的是，将“révisé”匹配为 false 的预期结果并未出现。相反，它匹配为 true。这是因为 \b 仅在 ASCII 单词边界上运行。

要解决此问题并准确匹配拉丁字符，我们可以用更具包容性的替代方案替换 \b 边界。这是一个示例：

import (
    "fmt"
    "regexp"
)

func main() {
    r, _ := regexp.Compile(`(?:\A|\s)(vis)(?:\s|\z)`)
    fmt.Println(r.MatchString("vis"))
    fmt.Println(r.MatchString("re vis e"))
    fmt.Println(r.MatchString("revise"))
    fmt.Println(r.MatchString("révisé"))
}

通过此修改，正则表达式现在使用字符串开头 (\A)、字符串结尾 (\z) 和空格 (\s) 的组合来识别单词的开头和结尾。结果准确地将“vis”匹配为 true，将“révisé”匹配为 false：

true
true
false
false

无论是否存在拉丁字符，此技术都可确保准确的单词匹配。

最新教程更多>

MySQL中如何高效地根据两个条件INSERT或UPDATE行？
在两个条件下插入或更新或更新 solution：的答案在于mysql的插入中...在重复键更新语法上。如果不存在匹配行或更新现有行，则此功能强大的功能可以通过插入新行来进行有效的数据操作。如果违反了唯一的密钥约束。实现所需的行为，该表必须具有唯一的键定义（在这种情况下为'名称'...

编程发布于2025-07-01
编译器报错“usr/bin/ld: cannot find -l”解决方法
错误：“ usr/bin/ld：找不到-l “ 此错误表明链接器在链接您的可执行文件时无法找到指定的库。为了解决此问题，我们将深入研究如何指定库路径并将链接引导到正确位置的详细信息。添加库搜索路径的一个可能的原因是，此错误是您的makefile中缺少库搜索路径。要解决它，您可以在链接器命令中添加...

编程发布于2025-07-01
如何处理PHP文件系统功能中的UTF-8文件名？
在PHP的Filesystem functions中处理UTF-8 FileNames 在使用PHP的MKDIR函数中含有UTF-8字符的文件很多flusf-8字符时，您可能会在Windows Explorer中遇到comploreer grounder grounder grounder gro...

编程发布于2025-07-01
Async Void vs. Async Task在ASP.NET中：为什么Async Void方法有时会抛出异常？
在ASP.NET async void void async void void void void void的设计无需返回asynchroncon而无需返回任务对象。他们在执行过程中增加未偿还操作的计数，并在完成后减少。在某些情况下，这种行为可能是有益的，例如未期望或明确预期操作结果的火灾和...

编程发布于2025-07-01
在Python中如何创建动态变量？
在Python 中，动态创建变量的功能可以是一种强大的工具，尤其是在使用复杂的数据结构或算法时，Dynamic Variable Creation的动态变量创建。 Python提供了几种创造性的方法来实现这一目标。利用dictionaries 一种有效的方法是利用字典。字典允许您动态创建密钥并分...

编程发布于2025-07-01
$\“（1）vs.（;;）：编译器优化是否消除了性能差异？\”$
\“（1）vs.（;;）：编译器优化是否消除了性能差异？\”
答案：在大多数现代编译器中，while（1）和（1）和（;;）之间没有性能差异。编译器： perl： 1 输入 - > 2 2 NextState（Main 2 -E：1）V-> 3 9 Leaveloop VK/2-> A 3 toterloop（next-> 8 last-> 9 ...

编程发布于2025-07-01
如何在Chrome中居中选择框文本？
选择框的文本对齐：局部chrome-inly-ly-ly-lyly solument 您可能希望将文本中心集中在选择框中，以获取优化的原因或提高可访问性。但是，在CSS中的选择元素中手动添加一个文本 - 对属性可能无法正常工作。初始尝试 state）</option> < op...

编程发布于2025-07-01
PHP SimpleXML解析带命名空间冒号的XML方法
在php 很少，请使用该限制很大，很少有很高。例如：这种技术可确保可以通过遍历XML树和使用儿童（）方法（）方法的XML树和切换名称空间来访问名称空间内的元素。

编程发布于2025-07-01
如何在鼠标单击时编程选择DIV中的所有文本？
在鼠标上选择div文本单击带有文本内容，用户如何使用单个鼠标单击单击div中的整个文本？这允许用户轻松拖放所选的文本或直接复制它。在单个鼠标上单击的div元素中选择文本，您可以使用以下Javascript函数： function selecttext（canduterid）{ if（do...

编程发布于2025-07-01
如何在其容器中为DIV创建平滑的左右CSS动画？
通用CSS动画，用于左右运动，我们将探索创建一个通用的CSS动画，以向左和右移动DIV，从而到达其容器的边缘。该动画可以应用于具有绝对定位的任何div，无论其未知长度如何。问题：使用左直接导致瞬时消失更加流畅的解决方案：混合转换和左 [并实现平稳的，线性的运动，我们介绍了线性的转换。这...

编程发布于2025-07-01
$在Ubuntu/linux上安装mysql-python时，如何修复\“ mysql_config \”错误？$
在Ubuntu/linux上安装mysql-python时，如何修复\“ mysql_config \”错误？
mysql-python安装错误：“ mysql_config找不到”“ 由于缺少MySQL开发库而出现此错误。解决此问题，建议在Ubuntu上使用该分发的存储库。使用以下命令安装Python-MysqldB： sudo apt-get安装python-mysqldb sudo pip in...

编程发布于2025-07-01
如何在Java中正确显示“ DD/MM/YYYY HH：MM：SS.SS”格式的当前日期和时间？
如何在“ dd/mm/yyyy hh：mm：mm：ss.ss”格式“ gormat 解决方案：的，请访问量很大，并应为procectiquiestate的，并在整个代码上正确格式不多： java.text.simpledateformat; 导入java.util.calendar; 导入java...

编程发布于2025-07-01
用户本地时间格式及时区偏移显示指南
在用户的语言环境格式中显示日期/时间，并使用时间偏移在向最终用户展示日期和时间时，以其localzone and格式显示它们至关重要。这确保了不同地理位置的清晰度和无缝用户体验。以下是使用JavaScript实现此目的的方法。方法：推荐方法是处理客户端的Javascript中的日期/时间格式化和时...

编程发布于2025-07-01
同实例无需转储复制MySQL数据库方法
在同一实例上复制一个MySQL数据库而无需转储在同一mySQL实例上复制数据库，而无需创建InterMediate sqql script。以下方法为传统的转储和IMPORT过程提供了更简单的替代方法。直接管道数据 MySQL手动概述了一种允许将mysqldump直接输出到MySQL clie...

编程发布于2025-07-01
在UTF8 MySQL表中正确将Latin1字符转换为UTF8的方法
在UTF8表中将latin1字符转换为utf8 ，您遇到了一个问题，其中含义的字符（例如，“jáuòiñe”）在utf8 table tabled tablesset中被extect（例如，“致电。为了解决此问题，您正在尝试使用“ mb_convert_encoding”和“ iconv”转换受...

编程发布于2025-07-01