"Si un trabajador quiere hacer bien su trabajo, primero debe afilar sus herramientas." - Confucio, "Las Analectas de Confucio. Lu Linggong"
Página delantera > Programación > ¿Cómo puedo dividir cadenas en palabras usando varios delimitadores de límites de palabras en Python?

¿Cómo puedo dividir cadenas en palabras usando varios delimitadores de límites de palabras en Python?

Publicado el 2024-12-23
Navegar:756

How Can I Split Strings into Words Using Multiple Word Boundary Delimiters in Python?

Dividir cadenas en palabras con múltiples delimitadores de límites de palabras

Cuando se trata de datos textuales, una tarea común implica dividir cadenas en palabras individuales. El método str.split() de Python ofrece una solución sencilla, pero solo admite un único delimitador como argumento. Esta limitación puede convertirse en un obstáculo cuando se trata de texto que contiene múltiples tipos de límites de palabras, como signos de puntuación.

El módulo re de Python proporciona una poderosa alternativa: re.split(). Esta función le permite especificar un patrón para usar como delimitador de límites de palabras. El patrón puede incluir expresiones regulares para hacer coincidir varios tipos de límites simultáneamente.

Por ejemplo, para dividir la siguiente cadena en palabras, manejando tanto los espacios en blanco como los signos de puntuación como límites de palabras:

"Hey, you - what are you doing here!?"

Puedes usar el siguiente patrón de expresión regular:

'\W '

Este patrón coincide con cualquier secuencia de caracteres que no son palabras (alfabéticos, numéricos o guiones bajos). Cuando se usa con re.split(), dividirá la cadena en todas las apariciones de estos caracteres, creando efectivamente una lista de palabras.

Así es como puedes usarlo en Python:

import re

text = "Hey, you - what are you doing here!?"
words = re.split('\W ', text)

print(words)

Salida:

['Hey', 'you', 'what', 'are', 'you', 'doing', 'here']

Como puede ver, re.split() divide efectivamente la cadena en palabras individuales, preservando los límites correctos de las palabras a pesar de la presencia de múltiples delimitadores. Esta flexibilidad la convierte en una herramienta valiosa para manejar escenarios complejos de análisis de texto, donde se encuentran múltiples delimitadores de límites de palabras.

Último tutorial Más>

Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.

Copyright© 2022 湘ICP备2022001581号-3