Comment gérer les paires de substitution dans Python Unicodes
En Python, les paires de substitution sont utilisées pour représenter les caractères Unicode au-delà du plan multilingue de base (BMP ). Ces paires sont constituées de deux points de code de substitution utilisés pour coder un seul caractère Unicode.
Lorsque vous travaillez avec des chaînes Unicode Python contenant des paires de substitution, vous pouvez rencontrer des erreurs liées au codage de substitution. Ces erreurs se produisent car Python gère les paires de substitution différemment selon le contexte.
Gestion des paires de substitution
Pour convertir une paire de substitution en chaîne normale, vous disposez de plusieurs options :
Utilisez le module json :
Encoder et décoder avec la méthode encode() :
Exemple :
emoji = "This is \ud83d\ude4f, an emoji."
encoded = emoji.encode("utf-16")
decoded = encoded.decode("utf-16")
print(decoded) # Output: "This is ?, an emoji."
Utilisez le gestionnaire d'erreurs surrogatepass :
Exemple :
encoded = emoji.encode("utf-16", "surrogatepass")
decoded = encoded.decode("utf-16")
print(decoded) # Output: "?"
Notez que l'approche que vous choisirez dépendra du contexte spécifique et du format de sortie souhaité.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3