Eliminación de emojis de las cadenas en python
el código de python proporcionado para eliminar emojis falla porque contiene errores de sintaxis. Las cadenas unicode deben designarse utilizando el prefijo U '' en Python 2. Además, el indicador Re.unicode debe pasar a la expresión regular, y los datos de entrada deben convertirse en unicode usando códecs:
import codecs
import re
text = codecs.decode('This dog \U0001f602'.encode('UTF-8'), 'UTF-8')
print(text) # with emoji
emoji_pattern = re.compile("["
u"\U0001F600-\U0001F64F" # emoticons
u"\U0001F300-\U0001F5FF" # symbols & pictographs
u"\U0001F680-\U0001F6FF" # transport & map symbols
u"\U0001F1E0-\U0001F1FF" # flags (iOS)
"] ", flags=re.UNICODE)
print(emoji_pattern.sub(r'', text)) # no emoji
[&]
este perro?este perro
: este patrón solo coincide con un rango limitado. Para una solución más completa, consulte los rangos de caracteres Unicode.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3