Как эффективно фильтровать объекты данных Pandas с помощью логического индексирования?

титульная страница > программирование > Как эффективно фильтровать объекты данных Pandas с помощью логического индексирования?

Как эффективно фильтровать объекты данных Pandas с помощью логического индексирования?

Опубликовано 1 ноября 2024 г.

Просматривать:386

How to Efficiently Filter Pandas Data Objects Using Boolean Indexing?

Эффективная фильтрация кадров и рядов данных Pandas с использованием логического индексирования

В сценариях анализа данных часто имеет решающее значение применение нескольких фильтров для сужения результатов. Целью этой статьи является рассмотрение эффективного подхода к объединению нескольких операций сравнения над объектами данных Pandas.

Задача

Цель состоит в том, чтобы обработать словарь реляционных операторов и применить их аддитивно к заданному Pandas. Series или DataFrame, в результате чего получается отфильтрованный набор данных. Эта операция требует минимизации ненужного копирования данных, особенно при работе с большими наборами данных.

Решение: логическое индексирование

Pandas предоставляет высокоэффективный механизм фильтрации данных с использованием логического индексирования. Логическое индексирование включает создание логических условий и последующую индексацию данных с использованием этих условий. Рассмотрим следующий пример:

df.loc[df['col1'] >= 1, 'col1']

Эта строка кода выбирает все строки в DataFrame df, где значение в столбце «col1» больше или равно 1. Результатом является новый объект Series, содержащий отфильтрованные значения.

Чтобы применить несколько фильтров, мы можем комбинировать логические условия, используя логические операторы, такие как & (и) и | (или). Например:

df[(df['col1'] >= 1) & (df['col1'] <= 1)]

Эта операция фильтрует строки, в которых 'col1' больше или равно 1 и меньше или равно 1.

Вспомогательные функции

To Упростив процесс применения нескольких фильтров, мы можем создать вспомогательные функции:

def b(x, col, op, n): 
    return op(x[col], n)

def f(x, *b):
    return x[(np.logical_and(*b))]

Функция b создает логическое условие для данного столбца и оператора, а f применяет несколько логических условий к DataFrame или Series.

Пример использования

Чтобы использовать эти функции, мы можем предоставить словарь критериев фильтра:

filters = {'>=': [1], 'b1 = b(df, 'col1', ge, 1)
b2 = b(df, 'col1', le, 1)
filtered_df = f(df, b1, b2)
Этот код применяет фильтры к столбцу «col1» в DataFrame df и возвращает новый DataFrame с отфильтрованными результатами.
Расширенная функциональность
В Pandas 0.13 появился метод запроса, который предлагает удобный способ применения фильтров с использованием строковых выражений. Для допустимых идентификаторов столбцов становится возможным следующий код: 
df.query('col1 Эта строка обеспечивает ту же фильтрацию, что и наша предыдущий пример с более кратким синтаксисом.
Используя логическое индексирование и вспомогательные функции, мы можем эффективно применять несколько фильтров к кадрам данных Pandas. и сериал. Такой подход сводит к минимуму копирование данных и повышает производительность, особенно при работе с большими наборами данных.

Заявление о выпуске Эта статья перепечатана по адресу: 1729395079. В случае каких-либо нарушений, пожалуйста, свяжитесь с [email protected], чтобы удалить ее.

Последний учебник Более>

Почему Microsoft Visual C ++ не может правильно реализовать двухфазной экземпляры?
загадка «Сломанная» двухфазное матричное экземпляры в Microsoft Visual C Задача задачи: пользователи обычно выражают обеспокоенность Microso...

программирование Опубликовано в 2025-03-12
UTF-8 против Латинской 1: Секрет кодирования персонажа!
различение UTF-8 и latin1 При работе с кодированием появляется два заметных варианта: UTF-8 и latin1. Среди их приложений возникает фундамента...

программирование Опубликовано в 2025-03-12
Множество
методы являются FNS, которые можно вызвать на Objects ] Массивы являются объектами, следовательно, они также имеют методы в JS. ] ] Срез (...

программирование Опубликовано в 2025-03-12
Как я могу эффективно заменить несколько подстроков в строке Java?
заменить несколько подстроков в строку эффективно в Java , когда сталкивается с необходимостью заменить несколько подстроков в строке, это зама...

программирование Опубликовано в 2025-03-12
Часть SQL -инъекции: подробное объяснение передовых методов инъекции SQL
Автор: Trix Cyrus ] Waymap Pentesting Tool: нажмите здесь ] TrixSec GitHub: нажмите здесь Trixsec Telegram: нажмите здесь ] ] Advance...

программирование Опубликовано в 2025-03-12
Как мы можем обеспечить загрузку файлов от вредоносного контента?
Запасы безопасности с загрузкой файлов Загрузка файлов на сервер может представить значительные риски безопасности из -за потенциально злонаме...

программирование Опубликовано в 2025-03-12
Как удалить разрывы линии из строк, используя регулярные выражения в JavaScript?
удаление разрывов строки из строк В этом сценарии кода цель состоит в том, чтобы устранить разрывы строки из текстовой строки, считывающейся из ...

программирование Опубликовано в 2025-03-12
Почему выполнение JavaScript прекращается при использовании кнопки Firefox Back?
Проблема истории навигации: Javascript перестает выполнять после использования кнопки Firefox Back пользователи Firefox могут столкнуться с пр...

программирование Опубликовано в 2025-03-12
Как правильно вставить Blobs (изображения) в MySQL с помощью PHP?
вставьте Blobs в базы данных MySQL с PHP При попытке сохранить изображение в базе данных MySQL, вы можете столкнуться с проблемой. Это руково...

программирование Опубликовано в 2025-03-12
Могу ли я перенести свой шифрование с McRypt в OpenSSL и расшифровывает данные, заполненные McRypt, используя OpenSSL?
Обновление моей библиотеки шифрования с McRypt до OpenSSL Могу ли я обновить свою библиотеку шифрования с McRypt до OpenSSL? В OpenSSL можно л...

программирование Опубликовано в 2025-03-12
Существует ли разница в производительности между использованием зала и итератора для сбора сбора в Java?
для каждого цикла против итератора: эффективность в сборе Traversal введение при переселении коллекции в Java, выборе между использованием...

программирование Опубликовано в 2025-03-12
Как проверить, есть ли у объекта конкретный атрибут в Python?
Метод для определения атрибута объекта Этот запрос ищет метод для проверки присутствия конкретного атрибута в объекте. Рассмотрим следующий пр...

программирование Опубликовано в 2025-03-12
Подробное объяснение метода сбора случайных элементов Java Hashset/LinkedHashset
Поиск случайного элемента в наборе в программировании может быть полезно выбирать случайный элемент из коллекции, такой как набор. Java предоста...

программирование Опубликовано в 2025-03-12
Когда CSS приписывает отдачу от пикселей (PX) без единиц?
запасной для атрибутов CSS без единиц: примерное исследование CSS -атрибуты часто требуют единиц (например, PX, EM, %) для определения их знач...

программирование Опубликовано в 2025-03-12
Каковы были ограничения на использование current_timestamp с столбцами TimeStamp в MySQL до версии 5.6.5?
Restrictions on TIMESTAMP Columns with CURRENT_TIMESTAMP in DEFAULT or ON UPDATE Clauses in MySQL Versions Prior to 5.6.5Historically, in MySQL versio...

программирование Опубликовано в 2025-03-12