Pandas を使用したセミコロン区切りの .CSV ファイルの解析
カンマ区切り値 (CSV) ファイルを扱う場合は、適切に処理することが重要です正確なデータ解析を保証するための区切り文字。 Pandas は、セミコロンなどの非標準の区切り文字を含む CSV ファイルを読み取るための簡単なソリューションを提供します。
次のシナリオを考えてみましょう。次のような形式の .csv ファイルがあるとします。
a1;b1;c1;d1;e1;... a2;b2;c2;d2;e2;...
このファイルを pandas DataFrame にインポートするには、read_csv() 関数を使用できます。ただし、デフォルトでは、pandas は区切り文字がカンマであると想定します。セミコロン区切り文字を指定するには、次のように sep パラメータを使用します。
import pandas as pd
csv_path = "C:...."
data = pd.read_csv(csv_path, sep=';')
sep パラメーターを指定するのを忘れた場合、pandas のデフォルトの動作では、すべてのデータが単一の列として扱われるため、印刷時に誤った結果が生じます。 DataFrame.
このデフォルト動作の理由は、パンダがカンマが最も一般的な区切り文字であると想定しているためです。 sep パラメーターを指定すると、区切り文字としてセミコロンを使用するようにパンダに明示的に指示し、データを正しく解析できるようになります。
要約すると、パンダでセミコロンで区切られた CSV ファイルを扱うときは、必ず指定することを忘れないでください。 sep=';' read_csv() 関数で正確なデータ解析を取得します。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3