”工欲善其事,必先利其器。“—孔子《论语.录灵公》
首页 > 编程 > 如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?

如何删除 A 列中的重复项,同时保留 B 列中具有最高值的行?

发布于2024-11-11
浏览:983

How to Remove Duplicates in Column A While Keeping the Row with the Highest Value in Column B?

删除 A 列中的重复项时保留具有最高 B 值的行

当前的任务涉及删除 A 列中的重复值一个数据帧,同时保留 B 列中具有最高值的行。为了实现这一点,我们可以利用 Python Pandas 库中的内置函数。

一种方法是按 A 列对数据帧进行排序,然后丢弃重复项同时保持最后一次出现的情况。表达如下:

df.sort_values(by='A').drop_duplicates(subset='A', keep='last')

或者,更灵活的解决方案可以考虑到不同的标准,方法是按 A 列对数据帧进行分组。在每个组中,可以提取 B 列中具有最大值的行。这可以使用以下代码来实现:

df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])

By实施这两种方法中的任何一种,您都可以有效地消除 A 列中的重复值,同时确保保留 B 值最高的行。

最新教程 更多>

免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。

Copyright© 2022 湘ICP备2022001581号-3