Gleitkommawerte aus Zeichenfolgen mit regulären Ausdrücken extrahieren
Betrachten Sie die Aufgabe, einen Double-Wert aus einer Zeichenfolge zu extrahieren. Um dies mithilfe eines regulären Ausdrucks zu erreichen, sind die folgenden Schritte erforderlich:
Konstruieren Sie den Regexp:
import re
pattr = re.compile(???)
x = pattr.match("4.5")
Perl-kompatible reguläre Ausdrücke verwenden:
Ein geeigneter regulärer Ausdruck aus der Perl-Dokumentation zum Extrahieren von Gleitkommazahlen Werte sind:
re_float = re.compile("""(?x)
^
[ -]?\ * # an optional sign and space
( # integers or f.p. mantissas
\d # start with a ...
( # ? takes care of integers
\.\d* # mantissa a.b or a.
)?
|\.\d # mantissa .b
)
([eE][ -]?\d )? # optionally match an exponent
$""")
Übereinstimmungen suchen und abrufen:
Um den Double-Wert zu extrahieren, wenden Sie den kompilierten regulären Ausdruck auf die gewünschte Zeichenfolge an:
m = re_float.match("4.5")
print(m.group(0))
Dies wird ausgegeben:
4.5
Mehrere Werte aus einem String extrahieren:
Um mehrere Gleitkommawerte aus einer größeren Zeichenfolge zu extrahieren, verwenden Sie die Methode findall():
s = """4.5 abc -4.5 abc - 4.5 abc .1e10 abc . abc 1.01e-2 abc
1.01e-.2 abc 123 abc .123"""
print(re.findall(r"[ -]? *(?:\d (?:\.\d*)?|\.\d )(?:[eE][ -]?\d )?", s))
Dies gibt eine Liste der extrahierten Werte zurück, einschließlich:
['4.5', '-4.5', '- 4.5', ' .1e10', ' 1.01e-2', ' 1.01', '-.2', ' 123', ' .123']
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3