Omitir filas durante la importación CSV con Pandas
Al utilizar pandas.read_csv() para importar datos CSV, es posible que desee omitir ciertas filas . Sin embargo, el parámetro skiprows puede resultar confuso, ya que acepta tanto una lista como un número entero.
El parámetro skiprows le permite especificar filas para omitir desde el principio del archivo. Si proporciona una lista de números de fila, se omitirán esas filas. Si proporciona un número entero, omitirá esa cantidad de filas.
Por ejemplo, si tiene un archivo CSV donde la segunda fila contiene datos innecesarios y desea omitirlo, puede usar cualquiera de los siguientes métodos:
Saltar como lista (recomendado)
import pandas as pd
from io import StringIO
s = """1, 2
3, 4
5, 6"""
# Skip the second row using a list
df = pd.read_csv(StringIO(s), skiprows=[1], header=None)
# Output: Row with index 1 skipped
print(df)
Saltar como un número entero
# Skip the second row using an integer
df = pd.read_csv(StringIO(s), skiprows=1, header=None)
# Output: Row with index 1 skipped
print(df)
Tenga en cuenta que el uso de skiprows=1 omite la primera fila, mientras que skiprows=[1] omite la fila con índice 1. Esto se debe a que Python usa indexación basada en 0, donde el primer elemento de un la lista tiene índice 0.
Conclusión
Al comprender el comportamiento del parámetro skiprows, puede omitir de manera efectiva filas no deseadas durante Importación CSV usando pandas.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3