使用 Pandas 导入 CSV 时跳过行
使用 pandas.read_csv() 导入 CSV 数据时,您可能想要跳过某些行。但是,skiprows 参数可能会令人困惑,因为它同时接受列表和整数。
skiprows 参数允许您指定要从文件开头跳过的行。如果您提供行号列表,它将跳过这些行。如果您提供一个整数,它将跳过该行数。
例如,如果您有一个 CSV 文件,其中第二行包含不必要的数据并且您想要跳过它,您可以使用以下任意一种方法:
Skiprow as a List(推荐)
import pandas as pd
from io import StringIO
s = """1, 2
3, 4
5, 6"""
# Skip the second row using a list
df = pd.read_csv(StringIO(s), skiprows=[1], header=None)
# Output: Row with index 1 skipped
print(df)
Skiprow as an Integer
# Skip the second row using an integer
df = pd.read_csv(StringIO(s), skiprows=1, header=None)
# Output: Row with index 1 skipped
print(df)
请注意,使用skiprows=1会跳过第一行,而skiprows=[1]会跳过索引为1的行。这是因为Python使用基于0的索引,其中a中的第一个元素列表的索引为0。
结论
通过了解skiprows参数的行为,您可以有效地跳过使用 pandas 导入 CSV 期间不需要的行。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3