"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > `utf-8 '디코딩이`\\ xe9'에서`\\ xe9 '에서 실패하는 동안 왜'latin-1 '이 성공합니까?

`utf-8 '디코딩이`\\ xe9'에서`\\ xe9 '에서 실패하는 동안 왜'latin-1 '이 성공합니까?

2025-02-24에 게시되었습니다
검색:428

Why Does `utf-8` Decoding Fail on `\xe9` While `latin-1` Succeeds?
의 유효하지 않은 연속 바이트를 나타냅니다. v = O.Decode ( "UTF-8")

문자열 "\ XE9 char의 테스트"에는 바이트 \ xe9가 나타내는 문자가 포함됩니다. 이 바이트는 UTF-8 시퀀스에서 유효한 연속 바이트가 아니므로 "UTF-8"코덱은 디코딩 할 수 없습니다. 그러나 "Latin-1"코덱을 대신 사용할 때 디코딩이 성공합니다.

v = O.decode ( "latin-1")

이것은 "Latin-1"코덱이 해석하기 때문입니다 \ xe9는 UTF-8 시퀀스의 일부가 아닌 단일 바이트 문자로서. 결과적으로, 문자열은 unicodedecodeerror를 만나지 않고 문자열로 유지됩니다.

최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3