Pandas での CSV インポート中に行をスキップする
pandas.read_csv() を使用して CSV データをインポートする場合、特定の行をスキップしたい場合があります。 。ただし、skiprows パラメータはリストと整数の両方を受け入れるため、混乱を招く可能性があります。
skiprows パラメータを使用すると、ファイルの先頭からスキップする行を指定できます。行番号のリストを指定すると、それらの行はスキップされます。整数を指定すると、その行数がスキップされます。
たとえば、CSV ファイルの 2 行目に不要なデータが含まれており、それをスキップしたい場合は、次のいずれかを使用できます。メソッド:
リストとしてスキップ (推奨)
import pandas as pd
from io import StringIO
s = """1, 2
3, 4
5, 6"""
# Skip the second row using a list
df = pd.read_csv(StringIO(s), skiprows=[1], header=None)
# Output: Row with index 1 skipped
print(df)
Skiprow as an Integer
# Skip the second row using an integer
df = pd.read_csv(StringIO(s), skiprows=1, header=None)
# Output: Row with index 1 skipped
print(df)
skiprows=1 を使用すると最初の行がスキップされ、skiprows=[1] ではインデックス 1 の行がスキップされることに注意してください。これは、Python が 0 ベースのインデックスを使用するためです。 list のインデックスは 0 です。
結論
skiprows パラメーターの動作を理解することで、pandas を使用した CSV インポート中に不要な行を効果的にスキップできます。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3