Usando codificação UTF-8 no código-fonte Python
Em certos cenários, você pode encontrar erros relacionados a caracteres não ASCII ao trabalhar com Strings Unicode no código-fonte Python. Isso ocorre porque a codificação padrão para arquivos de origem do Python 2 não é UTF-8.
Declarando strings UTF-8
No Python 3, UTF-8 é o padrão codificação de origem, para que você possa usar caracteres Unicode diretamente sem qualquer declaração especial. No entanto, no Python 2, você precisa declarar explicitamente a codificação UTF-8 no cabeçalho do arquivo de origem usando a seguinte sintaxe:
# -*- coding: utf-8 -*-
Coloque esta linha no início do seu arquivo de origem Python 2.
Por exemplo, considere o seguinte código Python 2:
# -*- coding: utf-8 -*-
u = 'idzie wąż wąską dróżką'
uu = u.decode('utf8')
s = uu.encode('cp1250')
print(s)
Este código usa codificação UTF-8 e converte com êxito a string Unicode em uma string de bytes codificada CP1250 para impressão.
Ao declarar a codificação UTF-8, você garante que Python interpretará os caracteres Unicode corretamente e evitará erros relacionados a caracteres não ASCII. É importante ressaltar que esta declaração deve ser colocada no início do arquivo fonte, antes de qualquer outro código.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3