Как эффективно обрабатывать большие файлы CSV в Python 2.7?

титульная страница > программирование > Как эффективно обрабатывать большие файлы CSV в Python 2.7?

Как эффективно обрабатывать большие файлы CSV в Python 2.7?

Опубликовано в 2025-03-05

Просматривать:130

How to Effectively Handle Large CSV Files in Python 2.7?

Чтение больших файлов .csv в Python

задача: Чтение массивных файлов .csv (до 1 миллиона рядов, 200 столбцов) в Python 2.7. Ошибки памяти. Однако этот метод становится непрактичным для больших файлов, поскольку он потребляет чрезмерную память. Процесс строк по мере их создания:

Избегайте загрузки всего файла в память. Вместо этого обрабатывает строки по мере их сгенерирования с использованием функции генератора. с Open (имя файла, «rb») как csvfile: dataReader = csv.reader (csvfile) Получите следующий (DataReader) # Получить строку заголовка Для строки в DataReader: Если строка [3] == Критерий: Учитывать ряд

2. Используйте функции генератора для фильтрации:

фильтра данных при обращении через файл с использованием функций генератора. Этот подход позволяет соответствовать нескольким последовательным строкам, отвечающим конкретному критерию. с Open (имя файла, «rb») как csvfile: dataReader = csv.reader (csvfile) Получите следующий (DataReader) # Получить строку заголовка урожай от дубля ( Lambda R: R [3] == Критерий, Dropwhile (Lambda R: R [3]! = Критерий, DataReader)) return

3. Оптимизируйте потребление памяти:

]

def getstuff(filename, criterion):
    with open(filename, "rb") as csvfile:
        datareader = csv.reader(csvfile)
        yield next(datareader)  # yield the header row
        for row in datareader:
            if row[3] == criterion:
                yield row

Refactor getData () для использования функции генератора, гарантируя, что только одна строка хранится в памяти в любое время.

Дополнительные советы для скорости:

]

def getstuff(filename, criterion):
    with open(filename, "rb") as csvfile:
        datareader = csv.reader(csvfile)
        yield next(datareader)  # yield the header row
        for row in datareader:
            if row[3] == criterion:
                yield row

Использовать CSV.Reader с параметрам размера чанка: читать файлы в меньших чанах, чтобы уменьшить FOMARINT. В базе данных для более быстрой и более эффективной обработки.

]

Последний учебник Более>

Триггер скрытый метод ввода элемента файла jQuery
запуска ввода файла с использованием jQuery при попытке запустить поле для загрузки с использованием jQuery с использованием триггера ('cl...

программирование Опубликовано в 2025-04-15
$Разрешить исключение \\ "Ошибка строкового значения \\"$
Разрешить исключение \\ "Ошибка строкового значения \\"
разрешение исключения неверного строкового значения при вставке эмоджи при попытке вставить строку, содержащую символы эмоджи в базу данных mysq...

программирование Опубликовано в 2025-04-15
SQL Server: выберите функцию или сохраненную процедуру?
SQL Server Функции и сохраненные процедуры: Руководство по выбору ] в SQL Server, выбор функции или хранимой процедуры зависит от конкретных тр...

программирование Опубликовано в 2025-04-15
Почему PHP DateTime :: Modify ('+1 месяц') дает неожиданные результаты?
изменение месяцев с PHP DateTime: раскрыть предполагаемое поведение при работе с классом DateTime PHP, добавление или вычитание месяцев не все...

программирование Опубликовано в 2025-04-15
Может ли std :: shared_ptr обеспечить безопасность потока объекта?
Соображения безопасности потока с помощью std :: shared_ptr следовать отрезок. Это гарантирует, что право собственности на объект отслеживае...

программирование Опубликовано в 2025-04-15
Найти качественное вдохновение веб -дизайна
У меня может быть только список для вас, приятель (если вам больше интересно, я собрал более 50 веб -сайтов, которые я использую в качестве веб -ра...

программирование Опубликовано в 2025-04-15
Как безопасно преобразовать переменные в динамические типы в C#?
подчиняющий переменную в динамический тип type inttype = typeof (int32); Ввод объекта = 1000,1; // кастинг в int int output = (int) convert.c...

программирование Опубликовано в 2025-04-15
Как эффективно обрабатывать параметры командной строки в приложениях Winforms?
Winforms Приложения часто должны передавать параметры командной строки между различными приложениями. В этой статье представлены несколько методо...

программирование Опубликовано в 2025-04-15
Как захватить и транслировать Stdout в режиме реального времени для выполнения команды Chatbot?
захватывание Stdout в режиме реального времени из выполнения команды В сфере разработки чат -ботов, способных выполнять команды, является общи...

программирование Опубликовано в 2025-04-15
Как эффективно получить последнюю строку для каждого уникального идентификатора в PostgreSQL?
postgresql: извлечение последней строки для каждого уникального идентификатора В Postgresql вы можете столкнуться с ситуациями, где вам необхо...

программирование Опубликовано в 2025-04-15
10 jQuery, Mootools, прототип легких всплывающих сценариев
В этом посте представлена коллекция сценариев и плагинов Lightbox, созданных с использованием различных библиотек JavaScript, включая JQUERY, Mooto...

программирование Опубликовано в 2025-04-15
Подробный учебник по преобразованию HTML в PDF с использованием itExtsharp
itextsharp: ваше руководство по преобразованию HTML-to-PDF ] Это руководство обеспечивает полное прохождение использования библиотеки ItextShar...

программирование Опубликовано в 2025-04-15
Как резервное копирование и восстановить единственный таблицу MySQL?
резервное копирование и восстановление одной таблицы Mysql По умолчанию утилита Mysqldump поддерживает всю базу данных. Однако может потребова...

программирование Опубликовано в 2025-04-15
Как я могу эффективно заменить несколько подстроков в строке Java?
заменить несколько подстроков в строку эффективно в Java , когда сталкивается с необходимостью заменить несколько подстроков в строке, это зама...

программирование Опубликовано в 2025-04-15
Как Android отправляет данные POST на PHP Server?
Отправка данных в Android введение Эта статья рассматривает необходимость отправки данных в сценарий PHP и отобразить результат в приложен...

программирование Опубликовано в 2025-04-15