Determinando os pontos do código UCS-2 para os caracteres utf-8 em php
A tarefa em questão é extrair os pontos de código UCS-2 para caracteres dentro de uma determinada string UTF-8. Para conseguir isso, uma função PHP personalizada pode ser definida. Cada caractere é representado por uma sequência de 1 a 4 bytes, dependendo do seu ponto de código Unicode. The ranges for each byte size are as follows:
0xxxxxxx: 1 byte& &&] 110: 2 BYTE CARETE
Exemplo de uso:
Para usar a função, basta fornecer um caractere utf-8 como entrada:
$ char = " ñ "; $ codePoint = get_ucs2_codePoint ($ char); eco "UCS-2 Código ponto: $ codePoint \ n";
function get_ucs2_codepoint($char)
{
// Initialize the code point
$codePoint = 0;
// Get the first byte
$firstByte = ord($char);
// Determine the number of bytes
if ($firstByte output: UCS-2 Código Ponto: 241
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3