Действительно ли циклы for в pandas плохи? Когда мне следует беспокоиться?
Введение
Хотя pandas известна своими векторизованными операциями, которые ускоряют вычисления, многие примеры кода по-прежнему содержат циклы. Хотя в документации предлагается избегать итераций по данным, в этой статье рассматриваются сценарии, в которых циклы for обеспечивают лучшую производительность, чем векторизованные подходы.
Итерация против векторизации малых данных
Для Для небольших данных циклы for могут превосходить векторизованные функции из-за накладных расходов, связанных с обработкой последних выравнивания осей, смешанных типов данных и отсутствующих данных. Понимание списков, в котором используются оптимизированные итеративные механизмы, выполняется еще быстрее.
Операции со смешанными/объектными типами d
Сравнение на основе строк:
Доступ к элементам словаря/списка:
Операции с регулярными выражениями
Когда следует рассматривать циклы for
Для небольших строк DataFrames:
Смешанные типы данных:
Обычный выражения:
Вывод
Хотя векторизованные функции обеспечивают простоту и удобочитаемость, важно учитывать решения на основе циклов в конкретных сценариях. Рекомендуется тщательное тестирование, чтобы определить наиболее подходящий подход для ваших требований к производительности.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3