列 A の重複を削除するときに、最も高い B 値を持つ行を維持する
当面のタスクには、列 A の重複値を削除することが含まれます。列 B で最も高い値を持つ行を保持しながらデータフレームを作成します。これを実現するには、Python の Pandas ライブラリ内の組み込み関数を利用できます。
1 つの方法では、データフレームを列 A で並べ替えて重複を破棄します。最後の出現を維持しながら。これは以下のように表現されます:
df.sort_values(by='A').drop_duplicates(subset='A', keep='last')
あるいは、より柔軟なソリューションとして、さまざまな基準を考慮して、データフレームを列 A でグループ化します。各グループ内で、列 B の最大値を持つ行を抽出できます。これは、次のコードを使用して実現できます:
df.groupby('A', group_keys=False).apply(lambda x: x.loc[x.B.idxmax()])
Byこれらの方法のいずれかを実装すると、列 A の重複する値を効果的に削除しながら、最も高い B 値を持つ行を確実に保持できます。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3