Omitir filas durante la importación de CSV con Pandas
Al importar datos CSV con Pandas, a menudo es necesario omitir filas que no desea incluir en su análisis. Sin embargo, la ambigüedad que rodea al argumento skiprows puede resultar confusa.
La sintaxis de skiprows es la siguiente:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
Surge la pregunta: ¿Cómo sabe Pandas si debe omitir la primera fila o la fila con índice? 1 cuando se especifica skiprows=1?
Para resolver esto, realicemos un experimento usando un archivo CSV de muestra con tres filas:
1, 2 3, 4 5, 6
Omitir la fila con el índice 1
Si desea omitir la fila con el índice 1, pase skiprows como una lista:
import pandas as pd
from io import StringIO
s = """1, 2
... 3, 4
... 5, 6"""
df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1
print(df)
Salida:
0 1 0 1 2 1 5 6
Omitir una cantidad de filas
Para omitir una cantidad específica de filas (en este caso, 1), pase skiprows como un número entero:
df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row
print(df)
Salida:
0 1 0 3 4 1 5 6
Por lo tanto, está claro que el argumento skiprows se comporta de manera diferente dependiendo de si proporcionas una lista o un número entero. Si desea omitir una fila por su índice, use una lista. De lo contrario, utilice un número entero para omitir un número específico de filas desde el principio del archivo.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3