如何找到一個資料幀中存在但另一個資料幀中不存在的行（比較 df1 和 df2）？

首頁 > 程式設計 > 如何找到一個資料幀中存在但另一個資料幀中不存在的行（比較 df1 和 df2）？

如何找到一個資料幀中存在但另一個資料幀中不存在的行（比較 df1 和 df2）？

發佈於2024-11-08

How to Find Rows Present in One Dataframe but Not in Another (Comparing df1 and df2)?

比較資料幀：尋找中存在但另一個中不存在的行

比較資料幀以識別差異對於資料品質保證和合併至關重要營運。在本例中，我們有兩個具有特定結構的資料幀（df1 和 df2），需要確定 df2 中存在但 df1 中不存在的行。

最初，嘗試使用 df1 != df2 比較資料幀，結果是錯誤。此方法僅適用於具有相同行和列的資料框。為了找到對稱差異，我們需要不同的方法。

一種方法涉及連接資料幀：

df = pd.concat([df1, df2])
df = df.reset_index(drop=True)

然後，按所有列將連接的資料幀分組：

df_gpby = df.groupby(list(df.columns))

接下來，我們透過取得僅存在一行的索引值來識別唯一記錄：

idx = [x[0] for x in df_gpby.groups.values() if len(x) == 1]

使用這些索引，我們可以過濾資料幀以獲得所需的結果：

df.reindex(idx)

此方法提供df2 中存在但不存在的行在df1 中基於日期索引和Fruit 列的比較。

版本聲明本文轉載於：1729343178如有侵犯，請洽[email protected]刪除

最新教學更多>

如何在整個HTML文檔中設計特定元素類型的第一個實例？

程式設計發佈於2025-03-11
如何使用組在MySQL中旋轉數據？
在關係數據庫中使用mySQL組使用mySQL組進行查詢結果，在關係數據庫中使用MySQL組，轉移數據的數據是指重新排列的行和列的重排以增強數據可視化。在這裡，我們面對一個共同的挑戰：使用組的組將數據從基於行的基於列的轉換為基於列。 Let's consider the following ...

程式設計發佈於2025-03-11
Java是否允許多種返回類型：仔細研究通用方法？
在Java中的多個返回類型：一種誤解類型：在Java編程中揭示，在Java編程中，Peculiar方法簽名可能會出現，可能會出現，使開發人員陷入困境，使開發人員陷入困境。 getResult（string s）; ，其中foo是自定義類。該方法聲明似乎擁有兩種返回類型：列表和E。但這確實是如此嗎...

程式設計發佈於2025-03-11
如何從Google API中檢索最新的jQuery庫？
從Google APIS 問題中提供的jQuery URL是版本1.2.6。對於檢索最新版本，以前有一種使用特定版本編號的替代方法，它是使用以下語法：獲取最新版本：未壓縮）While these legacy URLs still remain in use, it is recommended ...

程式設計發佈於2025-03-11
如何使用替換指令在GO MOD中解析模塊路徑差異？
在使用GO MOD時，在GO MOD 中克服模塊路徑差異時，可能會遇到衝突，其中3個Party Package將另一個PAXPANCE帶有導入式套件之間的另一個軟件包，並在導入式套件之間導入另一個軟件包。如迴聲消息所證明的那樣： go.etcd.io/bbolt [&&&&&&&&&&&&&&&&...

程式設計發佈於2025-03-11
為什麼使用固定定位時，為什麼具有100％網格板柱的網格超越身體？
網格超過身體，用100％grid-template-columns 為什麼在grid-template-colms中具有100％的顯示器，當位置設置為設置的位置時，grid-template-colly修復了？問題：考慮以下CSS和html： class =“ snippet-code”> ...

程式設計發佈於2025-03-11
為什麼PYTZ最初顯示出意外的時區偏移？
與pytz 最初從pytz獲得特定的偏移。例如，亞洲/hong_kong最初顯示一個七個小時37分鐘的偏移：差異源利用本地化將時區分配給日期，使用了適當的時區名稱和偏移量。但是，直接使用DateTime構造器分配時區不允許進行正確的調整。 example pytz.timezone（&#...

程式設計發佈於2025-03-11
如何使用Regex在PHP中有效地提取括號內的文本
php：在括號內提取文本在處理括號內的文本時，找到最有效的解決方案是必不可少的。一種方法是利用PHP的字符串操作函數，如下所示：作為替代 $ text ='忽略除此之外的一切（text）'; preg_match（'＃（（。 &&& [Regex使用模式來搜索特...

程式設計發佈於2025-03-11
為什麼我會收到MySQL錯誤＃1089：錯誤的前綴密鑰？
mySQL錯誤＃1089：錯誤的前綴鍵錯誤descript [＃1089-不正確的前綴鍵在嘗試在表中創建一個prefix鍵時會出現。前綴鍵旨在索引字符串列的特定前綴長度長度，可以更快地搜索這些前綴。了解prefix keys `這將在整個Movie_ID列上創建標準主鍵。主密鑰對於唯一識...

程式設計發佈於2025-03-11
$哪種方法更有效地用於點 - 填點檢測：射線跟踪或matplotlib \的路徑contains_points？$
哪種方法更有效地用於點 - 填點檢測：射線跟踪或matplotlib \的路徑contains_points？
在Python Matplotlib's path.contains_points FunctionMatplotlib's path.contains_points function employs a path object to represent the polygon.它...

程式設計發佈於2025-03-11
如何在JavaScript對像中動態設置鍵？
在嘗試為JavaScript對象創建動態鍵時，如何使用此Syntax jsObj['key' i] = 'example' 1;不工作。正確的方法採用方括號： jsobj ['key''i] ='example'1; 在JavaScript中，數組是一...

程式設計發佈於2025-03-11
PHP陣列鍵值異常：了解07和08的好奇情況
PHP數組鍵值問題，使用07&08 在給定數月的數組中，鍵值07和08呈現令人困惑的行為時，就會出現一個不尋常的問題。運行print_r（$月份）返回意外結果：鍵“ 07”丟失，而鍵“ 08”分配給了9月的值。此問題源於PHP對領先零的解釋。當一個數字帶有0（例如07或08）的前綴時，PHP...

程式設計發佈於2025-03-11
在Java中使用for-to-loop和迭代器進行收集遍歷之間是否存在性能差異？
For Each Loop vs. Iterator: Efficiency in Collection TraversalIntroductionWhen traversing a collection in Java, the choice arises between using a for-...

程式設計發佈於2025-03-11
如何在Java字符串中有效替換多個子字符串？
在java 中有效地替換多個substring，需要在需要替換一個字符串中的多個substring的情況下，很容易求助於重複應用字符串的刺激力量。 However, this can be inefficient for large strings or when working with nu...

程式設計發佈於2025-03-11
如何使用不同數量列的聯合數據庫表？
合併列數不同的表當嘗試合併列數不同的數據庫表時，可能會遇到挑戰。一種直接的方法是在列數較少的表中，為缺失的列追加空值。例如，考慮兩個表，表 A 和表 B，其中表 A 的列數多於表 B。為了合併這些表，同時處理表 B 中缺失的列，請按照以下步驟操作：確定表 B 中缺失的列，並將它們添加到表的...

程式設計發佈於2025-03-11