在Python 原始碼中使用UTF-8 編碼
在某些情況下,使用時可能會遇到與非ASCII 字元相關的錯誤Python 原始碼中的Unicode 字串。這是因為 Python 2 原始檔的預設編碼不是 UTF-8。
聲明 UTF-8 字串
在 Python 3 中,UTF-8 是預設編碼來源編碼,因此可以直接使用Unicode字符,無需任何特殊聲明。然而,在Python 2中,您需要使用以下語法在來源文件頭中明確聲明UTF-8編碼:
# -*- coding: utf-8 -*-
將此行放在Python 2 原始檔的開頭。
例如,考慮以下 Python 2 程式碼:
# -*- coding: utf-8 -*-
u = 'idzie wąż wąską dróżką'
uu = u.decode('utf8')
s = uu.encode('cp1250')
print(s)
此代碼使用 UTF-8 編碼,並成功將 Unicode 字串轉換為 CP1250 編碼的位元組字串以進行列印。
透過聲明 UTF-8 編碼,您可以確保 Python將正確解釋 Unicode 字元並避免與非 ASCII 字元相關的錯誤。請務必注意,此聲明必須放置在原始檔案的開頭,任何其他程式碼之前。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3