删除 A 列中的重复项时保留具有最高 B 值的行
当前的任务涉及删除 A 列中的重复值一个数据帧,同时保留 B 列中具有最高值的行。为了实现这一点,我们可以利用 Python Pandas 库中的内置函数。
一种方法是按 A 列对数据帧进行排序,然后丢弃重复项同时保持最后一次出现的情况。表达如下:
df.sort_values(by='A').drop_duplicates(subset='A', keep='last')
或者,更灵活的解决方案可以考虑到不同的标准,方法是按 A 列对数据帧进行分组。在每个组中,可以提取 B 列中具有最大值的行。这可以使用以下代码来实现:
df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])
By实施这两种方法中的任何一种,您都可以有效地消除 A 列中的重复值,同时确保保留 B 值最高的行。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3