在python pandas
例如,请考虑以下dataframe: a b c c 0 foo 0 a 1 foo 1 a 2 foo 1 b 3 bar 1 a
假设您要删除在'a'和''和'C'列中具有相同值的行在这种情况下,将消除第0和1行。先前,此任务需要手动过滤或复杂的操作。但是,随着熊猫的增强drop_duplicates功能,现在变得轻而易举。 Keep参数的引入使您可以控制重复的处理方式。
掉落在特定列上匹配的行,使用子集参数。通过设置为false,您可以指示大熊猫消除所有重复行:导入pandas作为pd df = pd.dataframe({“ a”:[“ foo”,“ foo”,“ foo”,“ bar”],“ b”:[0,1,1,1],“ C”:[a“ a”,“ a”,“ b”,“ b”,“ A”}) df.drop_duplicates(subset = ['a','c'],keep = false)
2 foo 1 b 3 bar 1 aA B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 bar 1 A的唯一行的行。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3