Lidando com strings UTF-8 em C no Windows
A codificação de strings como UTF-8 é amplamente usada para aplicativos de plataforma cruzada. No entanto, a saída de strings UTF-8 para std::cout no Windows apresenta desafios únicos.
O comportamento padrão no Windows é std::cout esperar strings em formatos não Unicode. Quando apresentado com strings UTF-8, ele exibe caracteres corrompidos.
Para resolver esse problema, há duas etapas principais:
Aqui está um trecho de código revisado que incorpora estas soluções:
#include
#include
#include
#include
int main() {
// Set console code page to UTF-8
SetConsoleOutputCP(CP_UTF8);
// Enable buffering to prevent byte-by-byte transmission
setvbuf(stdout, nullptr, _IOFBF, 1000);
// Output UTF-8 string
std::string test = u8"Greek: αβγδ; German: Übergrößenträger";
std::cout Além dessas etapas, observe que as fontes raster no console do Windows podem não exibir caracteres Unicode não ASCII corretamente. Para habilitar a renderização adequada, é recomendado mudar para uma fonte TrueType, que agora é o padrão no Windows 10 e versões posteriores.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3