Zeilen beim CSV-Import mit Pandas überspringen
Beim Importieren von CSV-Daten mit Pandas ist es oft notwendig, Zeilen zu überspringen, die Sie nicht möchten in Ihre Analyse einzubeziehen. Allerdings kann die Mehrdeutigkeit rund um das Skiprows-Argument verwirrend sein.
Die Syntax für Skiprows lautet wie folgt:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
Es stellt sich die Frage: Woher weiß Pandas, ob die erste Zeile oder die Zeile mit Index übersprungen werden soll 1, wenn „skiprows=1“ angegeben ist?
Um dies herauszufinden, führen wir ein Experiment mit einer Beispiel-CSV-Datei mit drei Zeilen durch:
1, 2 3, 4 5, 6
Überspringen der Zeile mit Index 1
Wenn Sie die Zeile mit Index 1 überspringen möchten, übergeben Sie Skiprows als Liste:
import pandas as pd
from io import StringIO
s = """1, 2
... 3, 4
... 5, 6"""
df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1
print(df)
Ausgabe:
0 1 0 1 2 1 5 6
Eine Anzahl von Zeilen überspringen
Um eine bestimmte Anzahl von Zeilen zu überspringen (in diesem Fall 1), übergeben Sie Skiprows als Ganzzahl:
df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row
print(df)
Ausgabe:
0 1 0 3 4 1 5 6
Daher ist es klar, dass sich das Skiprows-Argument unterschiedlich verhält, je nachdem, ob Sie eine Liste oder eine Ganzzahl angeben. Wenn Sie eine Zeile anhand ihres Index überspringen möchten, verwenden Sie eine Liste. Andernfalls verwenden Sie eine Ganzzahl, um eine angegebene Anzahl von Zeilen vom Anfang der Datei zu überspringen.
Haftungsausschluss: Alle bereitgestellten Ressourcen stammen teilweise aus dem Internet. Wenn eine Verletzung Ihres Urheberrechts oder anderer Rechte und Interessen vorliegt, erläutern Sie bitte die detaillierten Gründe und legen Sie einen Nachweis des Urheberrechts oder Ihrer Rechte und Interessen vor und senden Sie ihn dann an die E-Mail-Adresse: [email protected] Wir werden die Angelegenheit so schnell wie möglich für Sie erledigen.
Copyright© 2022 湘ICP备2022001581号-3