「労働者が自分の仕事をうまくやりたいなら、まず自分の道具を研ぎ澄まさなければなりません。」 - 孔子、「論語。陸霊公」
表紙 > プログラミング > 「latin-1」が成功している間に、 `\\ xe9`で「utf-8」デコードが失敗するのはなぜですか?

「latin-1」が成功している間に、 `\\ xe9`で「utf-8」デコードが失敗するのはなぜですか?

2025-02-24に投稿されました
ブラウズ:766

Why Does `utf-8` Decoding Fail on `\xe9` While `latin-1` Succeeds?

unicodedeCodeerror:無効な継続バイト

「utf-8」コードセックを使用して文字列をデコードしようとするとき、エラー「unicodedecodeerror: ' UTF8 'コーデックはバイト0xe9 ... "をデコードできません..."が発生する可能性があります。これは、文字列内の無効な継続バイトを示します。 v = o.decode( "utf-8")

文字列「\ xe9 charのテスト」には、byte \ xe9で表される文字が含まれています。このバイトはUTF-8シーケンスの有効な継続バイトではないため、「UTF-8」コーデックはそれをデコードできません。

o = "a test of \xe9 char"
v = o.decode("utf-8")

これは、「ラテン-1」コーデックが解釈されるためですUTF-8シーケンスの一部としてではなく、シングルバイト文字としての\ xe9。したがって、文字列は、UnicodedeCodeErrorに遭遇することなく文字列のままです。

最新のチュートリアル もっと>

免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。

Copyright© 2022 湘ICP备2022001581号-3