«Если рабочий хочет хорошо выполнять свою работу, он должен сначала заточить свои инструменты» — Конфуций, «Аналитики Конфуция. Лу Лингун»
титульная страница > программирование > How to Find Rows Present in One Dataframe but Not in Another (Comparing df1 and df2)?

How to Find Rows Present in One Dataframe but Not in Another (Comparing df1 and df2)?

Опубликовано 7 ноября 2024 г.
Просматривать:504

How to Find Rows Present in One Dataframe but Not in Another (Comparing df1 and df2)?

Comparing Dataframes: Finding Rows Present in One but Not in the Other

Comparing dataframes to identify differences is crucial for data quality assurance and merging operations. In this case, we have two dataframes (df1 and df2) with a specific structure and need to determine the rows present in df2 but not in df1.

Initially, attempts to compare dataframes using df1 != df2 resulted in an error. This approach only works for dataframes with identical rows and columns. To find symmetric differences, we need a different approach.

One method involves concatenating the dataframes:

df = pd.concat([df1, df2])
df = df.reset_index(drop=True)

Then, grouping the concatenated dataframe by all columns:

df_gpby = df.groupby(list(df.columns))

Next, we identify the unique records by obtaining the index values where only one row exists:

idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]

Using these indices, we can filter the dataframe to obtain the desired result:

df.reindex(idx)

This approach provides the rows present in df2 but absent in df1 based on the comparison of the Date index and the Fruit column.

Заявление о выпуске Эта статья перепечатана по адресу: 1729343178. В случае каких-либо нарушений, пожалуйста, свяжитесь с [email protected], чтобы удалить ее.
Последний учебник Более>

Изучайте китайский

Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.

Copyright© 2022 湘ICP备2022001581号-3