Разбор файлов .CSV, разделенных точкой с запятой, с использованием Pandas
При работе с файлами со значениями, разделенными запятыми (CSV), важно правильно обрабатывать разделители для обеспечения точного анализа данных. Pandas предоставляет простое решение для чтения файлов CSV с нестандартными разделителями, например точкой с запятой.
Рассмотрим следующий сценарий: у вас есть файл .csv формата, подобного следующему:
a1;b1;c1;d1;e1;... a2;b2;c2;d2;e2;...
Чтобы импортировать этот файл в DataFrame pandas, вы можете использовать функцию read_csv(). Однако по умолчанию pandas предполагает, что разделителем является запятая. Чтобы указать разделитель точку с запятой, используйте параметр sep следующим образом:
import pandas as pd
csv_path = "C:...."
data = pd.read_csv(csv_path, sep=';')
Если вы забудете указать параметр sep, по умолчанию pandas будет обрабатывать все данные как один столбец, что приведет к ошибочным результатам при печати DataFrame.
Причина такого поведения по умолчанию заключается в том, что pandas предполагает, что запятые являются наиболее распространенным разделителем. Предоставляя параметр sep, вы явно указываете pandas использовать точки с запятой в качестве разделителей, обеспечивая правильный анализ ваших данных. сент=';' в функции read_csv() для получения точного анализа данных.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3