определение кодовых точек UCS-2 для символов UTF-8 в PHP
задача-извлечь кодовые точки UCS-2. Для символов в данной строке UTF-8. Для этого может быть определена пользовательская функция PHP. Каждый символ представлен последовательности от 1 до 4 байтов, в зависимости от его точки кода Unicode. Диапазоны для каждого размера байта следующие:
0xxxxxxx: 1 byte
11110: 4 Byte символ
function get_ucs2_codepoint ($ char) { // Инициализировать кодовую точку $ codepoint = 0; // Получить первый байт $ firstbyte = ord ($ char); // определить количество байтов if ($ firstbyte
] пример использования:
для использования функции, просто предоставьте символ UTF-8 как input:
function get_ucs2_codepoint($char)
{
// Initialize the code point
$codePoint = 0;
// Get the first byte
$firstByte = ord($char);
// Determine the number of bytes
if ($firstByte output:
ucs-2 Кодовая точка: 241
]
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3