如何使用布尔索引有效过滤 Pandas 数据对象？

首页 > 编程 > 如何使用布尔索引有效过滤 Pandas 数据对象？

如何使用布尔索引有效过滤 Pandas 数据对象？

发布于2024-11-01

How to Efficiently Filter Pandas Data Objects Using Boolean Indexing?

使用布尔索引对 Pandas 数据帧和系列进行高效过滤

在数据分析场景中，应用多个过滤器来缩小结果范围通常至关重要。本文旨在提出一种有效的方法来链接 Pandas 数据对象上的多个比较操作。

挑战

目标是处理关系运算符的字典并将它们附加地应用于给定的 Pandas Series 或 DataFrame，生成过滤后的数据集。此操作需要最大限度地减少不必要的数据复制，尤其是在处理大型数据集时。

解决方案：布尔索引

Pandas 提供了一种使用布尔索引过滤数据的高效机制。布尔索引涉及创建逻辑条件，然后使用这些条件对数据建立索引。考虑以下示例：

df.loc[df['col1'] >= 1, 'col1']

这行代码选择 DataFrame df 中的所有行，其中“col1”列中的值大于或等于 1。结果是一个包含过滤值的新 Series 对象。

要应用多个过滤器，我们可以使用逻辑运算符（如 &）组合布尔条件。（和）和| （或者）。例如：

df[(df['col1'] >= 1) & (df['col1'] <= 1)]

此操作过滤其中的行'col1' 既大于或等于 1，又小于或等于 1。

辅助函数

为了简化应用多个过滤器的过程，我们可以创建辅助函数：

def b(x, col, op, n): 
    return op(x[col], n)

def f(x, *b):
    return x[(np.logical_and(*b))]

b 函数为给定列和运算符创建布尔条件，而 f 将多个布尔条件应用于 DataFrame 或 Series。

用法示例

要使用这些函数，我们可以提供过滤条件的字典：

filters = {'>=': [1], 'b1 = b(df, 'col1', ge, 1)
b2 = b(df, 'col1', le, 1)
filtered_df = f(df, b1, b2)
此代码将过滤器应用于 DataFrame df 中的“col1”列，并返回带有过滤结果的新 DataFrame。
增强功能
Pandas 0.13 引入了查询方法，它提供了一种使用字符串表达式应用过滤器的便捷方法。对于有效的列标识符，可以使用以下代码：
df.query('col1 这一行实现了与我们的相同的过滤前面的示例使用了更简洁的语法。
通过利用布尔索引和辅助函数，我们可以有效地将多个过滤器应用于 Pandas 数据帧和系列。这种方法可以最大限度地减少数据复制并提高性能，特别是在处理大型数据集时。

版本声明本文转载于：1729395079如有侵犯，请联系[email protected]删除

最新教程更多>

如何实时捕获和流媒体以进行聊天机器人命令执行？
在开发能够执行命令的chatbots的领域中，实时从命令执行实时捕获Stdout，一个常见的需求是能够检索和显示标准输出（stdout）在cath cath cant cant cant cant cant cant cant cant interfaces in Chate cant inter...

编程发布于2025-04-10
如何简化PHP中的JSON解析以获取多维阵列？
php 试图在PHP中解析JSON数据的JSON可能具有挑战性，尤其是在处理多维数组时。 To simplify the process, it's recommended to parse the JSON as an array rather than an object.To do...

编程发布于2025-04-10
如何有效地转换PHP中的时区？
在PHP 利用dateTime对象和functions DateTime对象及其相应的功能别名为时区转换提供方便的方法。例如： //定义用户的时区 date_default_timezone_set（'欧洲/伦敦'）; //创建DateTime对象 $ dateTime = ne...

编程发布于2025-04-10
您如何在Laravel Blade模板中定义变量？
在Laravel Blade模板中使用Elegance 在blade模板中如何分配变量对于存储以后使用的数据至关重要。在使用“ {{}}”分配变量的同时，它可能并不总是最优雅的解决方案。幸运的是，Blade通过@php Directive提供了更优雅的方法： $ old_section =“...

编程发布于2025-04-10
如何将PANDAS DataFrame列转换为DateTime格式并按日期过滤？
Transform Pandas DataFrame Column to DateTime FormatScenario:Data within a Pandas DataFrame often exists in various formats, including strings.使用时间数据时...

编程发布于2025-04-10
如何将来自三个MySQL表的数据组合到新表中？
mysql：从三个表和列的新表创建新表答案：为了实现这一目标，您可以利用一个3-way Join。选择p。*，d.content作为年龄来自人为p的人加入d.person_id = p.id上的d的详细信息加入T.Id = d.detail_id的分类法其中t.taxonomy =...

编程发布于2025-04-10
如何从PHP中的Unicode字符串中有效地产生对URL友好的sl。
为有效的slug生成首先，该函数用指定的分隔符替换所有非字母或数字字符。此步骤可确保slug遵守URL惯例。随后，它采用ICONV函数将文本简化为us-ascii兼容格式，从而允许更广泛的字符集合兼容性。接下来，该函数使用正则表达式删除了不需要的字符，例如特殊字符和空格。此步骤可确保slug仅包含...

编程发布于2025-04-10
为什么使用固定定位时，为什么具有100％网格板柱的网格超越身体？
网格超过身体，用100％grid-template-columns 为什么在grid-template-colms中具有100％的显示器，当位置设置为设置的位置时，grid-template-colly修复了？问题：考虑以下CSS和html： class =“ snippet-code”> g...

编程发布于2025-04-10
如何在JavaScript对象中动态设置键？
在尝试为JavaScript对象创建动态键时，如何使用此Syntax jsObj['key' i] = 'example' 1;不工作。正确的方法采用方括号： jsobj ['key''i] ='example'1; 在JavaScript中，数组是一...

编程发布于2025-04-10
如何在php中使用卷发发送原始帖子请求？
如何使用php 然后，配置以下选项： curlopt_url：请求 [要发送的原始数据指定内容类型，为原始的帖子请求指定身体的内容类型很重要。在这种情况下，它是文本/平原。要执行此操作，请使用包含以下标头的数组使用curlopt_httpheader选项：响应将存储在变量$ result。示例代码...

编程发布于2025-04-10
$为什么在我的Linux服务器上安装Archive_Zip后，我找不到“ class \” class \'ziparchive \'错误？$
为什么在我的Linux服务器上安装Archive_Zip后，我找不到“ class \” class \'ziparchive \'错误？
Class 'ZipArchive' Not Found Error While Installing Archive_Zip on Linux ServerSymptom:When attempting to run a script that utilizes the ZipAr...

编程发布于2025-04-10
Android如何向PHP服务器发送POST数据？
在android apache httpclient（已弃用） httpclient httpclient = new defaulthttpclient（）; httppost httppost = new httppost（“ http://www.yoursite.com/script.p...

编程发布于2025-04-10
如何使用Python有效地以相反顺序读取大型文件？
在python 中，如果您使用一个大文件，并且需要从最后一行读取其内容，则在第一行到第一行，Python的内置功能可能不合适。这是解决此任务的有效解决方案：反向行读取器生成器 == ord（'\ n'）：缓冲区=缓冲区[：-1] ...

编程发布于2025-04-10
如何使用不同数量列的联合数据库表？
合并列数不同的表当尝试合并列数不同的数据库表时，可能会遇到挑战。一种直接的方法是在列数较少的表中，为缺失的列追加空值。例如，考虑两个表，表 A 和表 B，其中表 A 的列数多于表 B。为了合并这些表，同时处理表 B 中缺失的列，请按照以下步骤操作：确定表 B 中缺失的列，并将它们添加到表的末...

编程发布于2025-04-10
如何在Java的全屏独家模式下处理用户输入？
Handling User Input in Full Screen Exclusive Mode in JavaIntroductionWhen running a Java application in full screen exclusive mode, the usual event ha...

编程发布于2025-04-10