”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 如何在熊猫中的特定列上有效删除重复行?

如何在熊猫中的特定列上有效删除重复行?

发布于2025-03-23
浏览:977

How Can I Efficiently Remove Duplicate Rows Across Specific Columns in Pandas?
在python pandas

python pandas

例如,请考虑以下dataframe: a b c c 0 foo 0 a 1 foo 1 a 2 foo 1 b 3 bar 1 a

假设您要删除在'a'和''和'C'列中具有相同值的行在这种情况下,将消除第0和1行。

先前,此任务需要手动过滤或复杂的操作。但是,随着熊猫的增强drop_duplicates功能,现在变得轻而易举。 Keep参数的引入使您可以控制重复的处理方式。

掉落在特定列上匹配的行,使用子集参数。通过设置为false,您可以指示大熊猫消除所有重复行:

导入pandas作为pd df = pd.dataframe({“ a”:[“ foo”,“ foo”,“ foo”,“ bar”],“ b”:[0,1,1,1],“ C”:[a“ a”,“ a”,“ b”,“ b”,“ A”}) df.drop_duplicates(subset = ['a','c'],keep = false)

2 foo 1 b 3 bar 1 a
    A   B   C
0   foo 0   A
1   foo 1   A
2   foo 1   B
3   bar 1   A
的唯一行的行。
最新教程 更多>

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3