在python pandas
例如,請考慮以下dataframe: a b c c 0 foo 0 a 1 foo 1 a 2 foo 1 b 3 bar 1 a
假設您要刪除在'a'和''和'C'列中具有相同值的行在這種情況下,將消除第0和1行。先前,此任務需要手動過濾或複雜的操作。但是,隨著熊貓的增強drop_duplicates功能,現在變得輕而易舉。 Keep參數的引入使您可以控制重複的處理方式。
掉落在特定列上匹配的行,使用子集參數。通過設置為false,您可以指示大熊貓消除所有重複行:導入pandas作為pd df = pd.dataframe({“ a”:[“ foo”,“ foo”,“ foo”,“ bar”],“ b”:[0,1,1,1],“ C”:[a“ a”,“ a”,“ b”,“ b”,“ A”}) df.drop_duplicates(subset = ['a','c'],keep = false)
2 foo 1 b 3 bar 1 aA B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 bar 1 A的唯一行的行。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3