UTF-8-Codierung im Python-Quellcode verwenden
In bestimmten Szenarien können beim Arbeiten mit Fehlern im Zusammenhang mit Nicht-ASCII-Zeichen auftreten Unicode-Strings im Python-Quellcode. Dies liegt daran, dass die Standardkodierung für Python 2-Quelldateien nicht UTF-8 ist.
Deklarieren von UTF-8-Zeichenfolgen
In Python 3 ist UTF-8 die Standardeinstellung Quellkodierung, sodass Sie Unicode-Zeichen ohne spezielle Deklaration direkt verwenden können. In Python 2 müssen Sie jedoch die UTF-8-Kodierung explizit im Quelldatei-Header mit der folgenden Syntax deklarieren:
# -*- coding: utf-8 -*-
Platzieren Sie diese Zeile am Anfang Ihrer Python 2-Quelldatei.
Betrachten Sie beispielsweise den folgenden Python 2-Code:
# -*- coding: utf-8 -*-
u = 'idzie wąż wąską dróżką'
uu = u.decode('utf8')
s = uu.encode('cp1250')
print(s)
Dieser Code verwendet die UTF-8-Kodierung und konvertiert die Unicode-Zeichenfolge zum Drucken erfolgreich in eine CP1250-kodierte Bytezeichenfolge.
Durch die Deklaration der UTF-8-Kodierung stellen Sie sicher, dass Python interpretiert die Unicode-Zeichen korrekt und vermeidet Fehler im Zusammenhang mit Nicht-ASCII-Zeichen. Es ist wichtig zu beachten, dass diese Deklaration am Anfang der Quelldatei und vor jedem anderen Code platziert werden muss.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3