«Если рабочий хочет хорошо выполнять свою работу, он должен сначала заточить свои инструменты» — Конфуций, «Аналитики Конфуция. Лу Лингун»
титульная страница > программирование > Почему «UTF-8` декодирование терпит неудачу на` \\ xe9 », а« Латин-1 »преуспевает?

Почему «UTF-8` декодирование терпит неудачу на` \\ xe9 », а« Латин-1 »преуспевает?

Опубликовано в 2025-02-24
Просматривать:766

] Why Does `utf-8` Decoding Fail on `\xe9` While `latin-1` Succeeds?

unicodedecodeerror: неверное продолжение Byte

]

при попытке декодировать строку с использованием «UTF-8», ошибка «UnicodeDecodeerror:» UTF8 'Codec не может декодировать byte 0xe9 ... "может возникнуть. Это указывает на неверный байт продолжения в строке. v = o.decode ("utf-8")

строка "тест \ xe9 char" содержит символ, представленный байтом \ xe9. Этот байт не является допустимым байтом продолжения в последовательности UTF-8, поэтому кодек «UTF-8» не может его декодировать.

o = "a test of \xe9 char"
v = o.decode("utf-8")

это потому, что кодек "Латин-1" интерпретирует \ xe9 как однобайтный символ, а не как часть последовательности UTF-8. Следовательно, строка остается строкой, не встречаясь с UnicodedeCodeError.

]
Последний учебник Более>

Изучайте китайский

Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.

Copyright© 2022 湘ICP备2022001581号-3