使用 Pandas 导入 CSV 时跳过行
使用 Pandas 导入 CSV 数据时,通常需要跳过不需要的行包含在您的分析中。然而,围绕skiprows参数的歧义可能会令人困惑。
skiprows的语法如下:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
问题出现了:Pandas 如何知道是跳过第一行还是有索引的行1 当指定skiprows=1 时?
为了解决这个问题,让我们使用包含三行的示例 CSV 文件进行实验:
1, 2 3, 4 5, 6
跳过索引为 1 的行
如果要跳过索引为 1 的行,请将skiprows 作为列表传递:
import pandas as pd
from io import StringIO
s = """1, 2
... 3, 4
... 5, 6"""
df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1
print(df)
输出:
0 1 0 1 2 1 5 6
跳过行数
要跳过特定行数(在本例中为 1),请将skiprows 作为整数传递:
df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row
print(df)
输出:
0 1 0 3 4 1 5 6
因此,很明显,skiprows 参数的行为会有所不同,具体取决于您提供的是列表还是整数。如果您想按索引跳过一行,请使用列表。否则,使用整数从文件开头跳过指定行数。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3