Saut de lignes lors de l'importation CSV avec Pandas
Lorsque vous utilisez pandas.read_csv() pour importer des données CSV, vous souhaiterez peut-être ignorer certaines lignes . Cependant, le paramètre skiprows peut prêter à confusion, car il accepte à la fois une liste et un entier.
Le paramètre skiprows vous permet de spécifier les lignes à ignorer depuis le début du fichier. Si vous fournissez une liste de numéros de lignes, ces lignes seront ignorées. Si vous fournissez un nombre entier, ce nombre de lignes sera ignoré.
Par exemple, si vous disposez d'un fichier CSV dont la deuxième ligne contient des données inutiles et que vous souhaitez l'ignorer, vous pouvez utiliser l'une des méthodes suivantes méthodes :
Ignorer sous forme de liste (recommandé)
import pandas as pd
from io import StringIO
s = """1, 2
3, 4
5, 6"""
# Skip the second row using a list
df = pd.read_csv(StringIO(s), skiprows=[1], header=None)
# Output: Row with index 1 skipped
print(df)
Sauter en tant qu'entier
# Skip the second row using an integer
df = pd.read_csv(StringIO(s), skiprows=1, header=None)
# Output: Row with index 1 skipped
print(df)
Notez que l'utilisation de skiprows=1 ignore la première ligne, tandis que skiprows=[1] ignore la ligne avec l'index 1. En effet, Python utilise une indexation basée sur 0, où le premier élément d'un list a l'index 0.
Conclusion
En comprenant le comportement du paramètre skiprows, vous pouvez efficacement ignorer les lignes indésirables lors de l'importation CSV à l'aide de pandas.
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3