Comment échapper aux caractères Unicode dans les cordes ASCII?

Page de garde > La programmation > Comment échapper aux caractères Unicode dans les cordes ASCII?

Comment échapper aux caractères Unicode dans les cordes ASCII?

Publié le 2025-03-22

Parcourir:371

How to Escape Unicode Characters in ASCII Strings?

Escape les caractères Unicode dans la chaîne ASCII

]

Dans certains scénarios de programmation, la conversion des caractères Unicode en chaînes ASCII échappées est une exigence commune. Ce processus permet de préserver les caractères Unicode, sinon il peut être perdu ou remplacé par d'autres caractères pendant le processus d'encodage.

Par exemple, une chaîne contenant le caractère Unicode π (Pi) doit être convertie en format ASCII échappé (\ U03A0). Cette conversion garantit que les caractères sont conservés même si la chaîne est codée dans des systèmes qui ne prennent pas en charge les caractères Unicode.

Pour ce faire, tous les caractères non ASCII de la chaîne doivent être remplacés par leur séquence d'échappement correspondante. Ces séquences d'échappement commencent par une barre oblique inverse (\) suivie d'une représentation hexadécimale des points de code Unicode. Par exemple, le point de code Unicode de π est 03A0, donc sa séquence d'échappement devient \ U03A0.

Le code C # suivant montre comment coder et décoder les caractères non ascii à l'aide de \ uxxxx fape format:

using System;
using System.Text.RegularExpressions;

class Program
{
    static void Main(string[] args)
    {
        string unicodeString = "此函数包含一个Unicode字符pi (\u03a0)";

        Console.WriteLine(unicodeString);

        string encoded = EncodeNonAsciiCharacters(unicodeString);
        Console.WriteLine(encoded);

        string decoded = DecodeEncodedNonAsciiCharacters(encoded);
        Console.WriteLine(decoded);
    }

    static string EncodeNonAsciiCharacters(string value)
    {
        StringBuilder sb = new StringBuilder();
        foreach (char c in value)
        {
            if (c > 127)
            {
                // 此字符对于ASCII来说太大
                string encodedValue = "\\u"   ((int)c).ToString("x4");
                sb.Append(encodedValue);
            }
            else
            {
                sb.Append(c);
            }
        }
        return sb.ToString();
    }

    static string DecodeEncodedNonAsciiCharacters(string value)
    {
        return Regex.Replace(
            value,
            @"\\u(?[a-zA-Z0-9]{4})",
            m =>
            {
                return ((char)int.Parse(m.Groups["Value"].Value, NumberStyles.HexNumber)).ToString();
            });
    }
}

Dans ce code, la méthode Encodeonasciicharacters traverse la chaîne d'entrée et reconnaît les caractères non ascii, les convertissant en leur séquence d'évasion. D'un autre côté, la méthode decodeencodedNonascIicharacters utilise une expression régulière pour analyser les chaînes échappées et les transformer en caractères Unicode originaux.

La sortie de ce programme démontre le processus:

此函数包含一个Unicode字符pi (π)
此函数包含一个Unicode字符pi (\u03a0)
此函数包含一个Unicode字符pi (π)

]

Dernier tutoriel Plus>

Comment générer un PDF à partir d'une réponse binaire du service Web en JavaScript à travers les navigateurs?
Faisant du PDF à partir de la réponse binaire Web-Service dans JavaScript Background: Cette question aborde le défi de la génération d'...

La programmation Publié le 2025-03-22
Anomalies de valeur clé du tableau PHP: Comprendre le cas curieux de 07 et 08
Problème de valeur de clé du tableau php avec 07 & 08 Un tableau contient divers éléments avec des touches associées. Dans PHP, un problème in...

La programmation Publié le 2025-03-22
Y a-t-il une différence de performance entre l'utilisation d'une boucle for-out et un itérateur pour la traversée de collecte en Java?
pour chaque boucle vs iterator: efficacité dans la collection Traversal introduction Lorsque vous traversez une collection dans Java, le c...

La programmation Publié le 2025-03-22
Pourquoi ma configuration de GO à Homebrew provoque-t-elle des problèmes d'exécution de ligne de commande?
Brew Go Configuration vs Exécution de la ligne de commande Vous avez initialement installé aller à l'aide de Homebrew, un gestionnaire de ...

La programmation Publié le 2025-03-22
Quelles ont été les restrictions sur l'utilisation de Current_timestamp avec des colonnes horodatotes dans MySQL avant la version 5.6.5?
Restrictions sur les colonnes horodat Clause actuelle_timestamp. Cette limitation s'est étendue aux entiers INT, BigInt et SmallInt lorsqu'...

La programmation Publié le 2025-03-22
Comment limiter la plage de défilement d'un élément dans un élément parent de taille dynamique?
Implémentation de limites de hauteur CSS pour les éléments de défilement vertical dans une interface interactive, le contrôle du comportement ...

La programmation Publié le 2025-03-22
ScriptableBrowser est-il l'équivalent PHP de WWW :: Mécanisé de Perl?
PHP Alternative à www :: mécanisé www :: mécanisé de Perl offre un moyen pratique d'effectuer des tâches d'automatisation Web telles qu...

La programmation Publié le 2025-03-22
Pourquoi cgo_enabled = 0 ralentit la compilation GO avec les opérations réseau?
Compilation des commandes de shell avec cgo_enabled = 0: un goulot d'étranglement de performances Lors de l'utilisation des opérations...

La programmation Publié le 2025-03-22
Pourquoi mon @ font-face ne fonctionne-t-il pas dans IE9 sur un site en direct?
Débogage des problèmes de font-face dans IE9 malgré le fonctionnement de manière transparente dans IE8 et d'autres navigateurs, @ Font-Face ...

La programmation Publié le 2025-03-22
Comment puis-je itérer et imprimer des valeurs de manière synchrone à partir de deux tableaux de taille égale en PHP?
itération et imprimant de manière synchrone à partir de deux tableaux de même taille lors de la création d'une SelectBox en utilisant deux t...

La programmation Publié le 2025-03-22
Comment résoudre les écarts de chemin du module dans GO Mod en utilisant la directive Remplacer?
surmonter la divergence du chemin du module dans go mod Lors de l'utilisation de Go Mod, il est possible de rencontrer un conflit où un pa...

La programmation Publié le 2025-03-22
Comment télécharger des fichiers avec des paramètres supplémentaires à l'aide de java.net.urlconnection et de codage multipart / formulaire de formulaire?
Téléchargement des fichiers avec des demandes http pour télécharger des fichiers sur un serveur http tout en soumettant des paramètres supplém...

La programmation Publié le 2025-03-22
Comment puis-je faire du texte enroulé autour d'une image dans le coin inférieur à droite d'une div dans CSS?
styliser le texte pour enrouler une div inférieure à droite dans CSS, il est souvent souhaitable de positionner une image dans le coin inférie...

La programmation Publié le 2025-03-22
La récupération de la panique peut-elle modifier les variables locales dans les littéraux de fonctions en Go?
La récupération de la panique peut-elle modifier les variables locales dans les littéraux de fonction? Dans Go, lorsque vous travaillez avec d...

La programmation Publié le 2025-03-22
$Pourquoi la demande de postn \ 'ne capture-t-elle pas d'entrée en PHP malgré le code valide?$
Pourquoi la demande de postn \ 'ne capture-t-elle pas d'entrée en PHP malgré le code valide?
Adresses du post Demande Dysfonctionnement en php Dans l'extrait de code présenté: "Méthode =" post "> " ...

La programmation Publié le 2025-03-22

Classification Plus>

Apprendre le japonais Apprendre le coréen Apprendre le chinois Apprendre une langue étrangère Jeu Problème commun Périphériques technologiques IA Tutoriel logiciel La programmation Article