使用正则表达式从字符串中提取浮点值
考虑从字符串中提取双精度值的任务。要使用正则表达式实现此目的,涉及以下步骤:
构造正则表达式:
import re
pattr = re.compile(???)
x = pattr.match("4.5")
使用 Perl 兼容的正则表达式:
Perl 文档中用于提取浮点的合适正则表达式值为:
re_float = re.compile("""(?x)
^
[ -]?\ * # an optional sign and space
( # integers or f.p. mantissas
\d # start with a ...
( # ? takes care of integers
\.\d* # mantissa a.b or a.
)?
|\.\d # mantissa .b
)
([eE][ -]?\d )? # optionally match an exponent
$""")
查找并检索匹配项:
要提取双精度值,请将已编译的正则表达式应用于所需的字符串:
m = re_float.match("4.5")
print(m.group(0))
这将输出:
4.5
从字符串中提取多个值:
要从较大的字符串中提取多个浮点值,请使用 findall() 方法:
s = """4.5 abc -4.5 abc - 4.5 abc .1e10 abc . abc 1.01e-2 abc
1.01e-.2 abc 123 abc .123"""
print(re.findall(r"[ -]? *(?:\d (?:\.\d*)?|\.\d )(?:[eE][ -]?\d )?", s))
这将返回提取值的列表,包括:
['4.5', '-4.5', '- 4.5', ' .1e10', ' 1.01e-2', ' 1.01', '-.2', ' 123', ' .123']
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3