使用Pandas 導入CSV 時跳過行
使用Pandas 導入CSV 資料時,通常需要跳過不需要的行包含在您的分析中。然而,圍繞skiprows參數的歧義可能會令人困惑。
skiprows的語法如下:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
問題出現了:Pandas 如何知道是跳過第一行還是有索引的行1 當指定skiprows=1 時?
為了解決這個問題,讓我們使用包含三行的範例 CSV 檔案進行實驗:
1, 2 3, 4 5, 6
跳過索引為1 的行
如果要跳過索引為1 的行,請將skiprows 作為列表傳遞:
import pandas as pd
from io import StringIO
s = """1, 2
... 3, 4
... 5, 6"""
df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1
print(df)
輸出:
0 1 0 1 2 1 5 6
跳過行數
要跳過特定行數(在本例中為1),請將skiprows 作為整數傳遞:
df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row
print(df)
輸出:
0 1 0 3 4 1 5 6
因此,很明顯,skiprows 參數的行為會有所不同,具體取決於您提供的是列表還是整數。如果您想按索引跳過一行,請使用清單。否則,使用整數從檔案開頭跳過指定行數。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3