Пропуск строк во время импорта CSV с помощью Pandas
При использовании pandas.read_csv() для импорта данных CSV вы можете пропустить определенные строки . Однако параметр jumprows может сбить с толку, поскольку он принимает как список, так и целое число.
Параметр jumprows позволяет указать строки для пропуска с начала файла. Если вы предоставите список номеров строк, эти строки будут пропущены. Если вы укажете целое число, оно пропустит указанное количество строк.
Например, если у вас есть CSV-файл, вторая строка которого содержит ненужные данные, и вы хотите пропустить его, вы можете использовать любое из следующих действий: методы:
Пропустить как список (рекомендуется)
import pandas as pd
from io import StringIO
s = """1, 2
3, 4
5, 6"""
# Skip the second row using a list
df = pd.read_csv(StringIO(s), skiprows=[1], header=None)
# Output: Row with index 1 skipped
print(df)
Пропустить как целое число
# Skip the second row using an integer
df = pd.read_csv(StringIO(s), skiprows=1, header=None)
# Output: Row with index 1 skipped
print(df)
Обратите внимание, что использование Skiprows=1 пропускает первую строку, а Skiprows=[1] пропускает строку с индексом 1. Это связано с тем, что Python использует индексацию, отсчитываемую от 0, где первый элемент в список имеет индекс 0.
Вывод
Понимая поведение параметра jumprows, вы можете эффективно пропускать нежелательные строки во время импорта CSV с использованием pandas.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3