Ignorando linhas durante a importação de CSV com Pandas
Ao usar pandas.read_csv() para importar dados CSV, você pode querer pular certas linhas . No entanto, o parâmetro skiprows pode ser confuso, pois aceita uma lista e um número inteiro.
O parâmetro skiprows permite especificar linhas a serem ignoradas desde o início do arquivo. Se você fornecer uma lista de números de linhas, essas linhas serão ignoradas. Se você fornecer um número inteiro, esse número de linhas será ignorado.
Por exemplo, se você tiver um arquivo CSV em que a segunda linha contém dados desnecessários e quiser ignorá-lo, poderá usar qualquer um dos seguintes métodos:
Ignorar como uma lista (recomendado)
import pandas as pd
from io import StringIO
s = """1, 2
3, 4
5, 6"""
# Skip the second row using a list
df = pd.read_csv(StringIO(s), skiprows=[1], header=None)
# Output: Row with index 1 skipped
print(df)
Ignorar como um número inteiro
# Skip the second row using an integer
df = pd.read_csv(StringIO(s), skiprows=1, header=None)
# Output: Row with index 1 skipped
print(df)
Observe que usar skiprows=1 pula a primeira linha, enquanto skiprows=[1] pula a linha com índice 1. Isso ocorre porque Python usa indexação baseada em 0, onde o primeiro elemento em um lista tem índice 0.
Conclusão
Ao compreender o comportamento do parâmetro skiprows, você pode efetivamente pular linhas indesejadas durante Importação de CSV usando pandas.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3