刪除A 列中的重複項時保留具有最高B 值的行
目前的任務涉及刪除A 列中的重複值一個資料幀,同時保留B 列中具有最高值的行。為了實現這一點,我們可以利用 Python Pandas 函式庫中的內建函數。
一種方法是按 A 列對資料幀進行排序,然後丟棄重複項同時保持最後一次出現的情況。表達如下:
df.sort_values(by='A').drop_duplicates(subset='A', keep='last')
或者,更靈活的解決方案可以考慮到不同的標準,方法是按A 列對資料幀進行分組。在每個組中,可以提取 B 列中具有最大值的行。這可以使用以下程式碼來實現:
df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])
By實施這兩種方法中的任何一種,您都可以有效地消除A 列中的重複值,同時確保保留B 值最高的行。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3