をドロップするpythonパンダの複数の列に重複する行
パンダのdrop_duplicates機能は、データフレーム、データクリーンティングのための未熟なツールからの重複した列を排除します。この機能を拡張するために、列を指定して一意性を確認できます。たとえば、次のデータフレームを検討してください:
a b c 0 foo 0 a 1 foo 1 a 2 foo 1 b 3 bar 1 a
A B C 0 foo 0 A 1 foo 1 A 2 foo 1 B 3 bar 1 A
PandasをPDとしてインポート df = pd.dataframe({"a":["foo"、 "foo"、 "foo"、 "bar"]、 "b":[0,1,1,1]、 "c":["a"、 "a"、 "b"、 "a"]}))) df.drop_duplicates(subset = ['a'、 'c']、keep = false)
output:
a b c 2 foo 1 b 3 bar 1 a
import pandas as pd df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]}) df.drop_duplicates(subset=['A', 'C'], keep=False)の値に基づいて一意の行のみが残ります。
免責事項: 提供されるすべてのリソースの一部はインターネットからのものです。お客様の著作権またはその他の権利および利益の侵害がある場合は、詳細な理由を説明し、著作権または権利および利益の証拠を提出して、電子メール [email protected] に送信してください。 できるだけ早く対応させていただきます。
Copyright© 2022 湘ICP备2022001581号-3