Python 소스 코드에서 UTF-8 인코딩 사용
특정 시나리오에서는 작업할 때 ASCII가 아닌 문자와 관련된 오류가 발생할 수 있습니다. Python 소스 코드의 유니코드 문자열. 이는 Python 2 소스 파일의 기본 인코딩이 UTF-8이 아니기 때문입니다.
UTF-8 문자열 선언
Python 3에서는 UTF-8이 기본값입니다. 소스 인코딩을 사용하므로 특별한 선언 없이 유니코드 문자를 직접 사용할 수 있습니다. 그러나 Python 2에서는 다음 구문을 사용하여 소스 파일 헤더에서 UTF-8 인코딩을 명시적으로 선언해야 합니다.
# -*- coding: utf-8 -*-
Python 2 소스 파일의 시작 부분에 이 줄을 배치합니다.
예를 들어 다음 Python 2 코드를 고려하세요.
# -*- coding: utf-8 -*-
u = 'idzie wąż wąską dróżką'
uu = u.decode('utf8')
s = uu.encode('cp1250')
print(s)
이 코드는 UTF-8 인코딩을 사용하고 유니코드 문자열을 인쇄용 CP1250 인코딩 바이트 문자열로 성공적으로 변환합니다.
UTF-8 인코딩을 선언하면 Python이 다음을 보장합니다. 유니코드 문자를 올바르게 해석하고 ASCII가 아닌 문자와 관련된 오류를 방지합니다. 이 선언은 다른 코드보다 먼저 소스 파일의 시작 부분에 배치되어야 한다는 점에 유의하는 것이 중요합니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3