Recuperar las primeras N líneas de un archivo
A menudo, cuando se trabaja con archivos grandes de datos sin procesar, es necesario extraer un número específico de líneas para su posterior procesamiento o análisis. En Python, existen múltiples enfoques para realizar esta tarea.
Leer las primeras N líneas usando la comprensión de listas
Un método simple y efectivo implica utilizar la comprensión de listas:
with open(path_to_file) as input_file:
head = [next(input_file) for _ in range(lines_number)]
print(head)
Este enfoque itera a través del archivo de entrada usando la función next() y almacena las primeras líneas_número de líneas en la lista de encabezados.
Usando la función islice()
Otro enfoque aprovecha el módulo itertools de Python:
from itertools import islice
with open(path_to_file) as input_file:
head = list(islice(input_file, lines_number))
print(head)
Aquí, la función islice() se utiliza para iterar sobre las primeras líneas_número de líneas del archivo de entrada, creando una lista de las líneas extraídas.
Efecto de Sistema operativo
La implementación descrita anteriormente debería funcionar independientemente del sistema operativo que se utilice. Sin embargo, vale la pena señalar que en Python 2, la función next() se conoce como xrange(), lo que puede requerir los ajustes correspondientes en bases de código más antiguas.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3