組合 Pandas 資料框:在公共列上連接
Joinder 是基於公共屬性合併資料框的基本操作。本問題研究組合兩個 pandas 資料幀的問題:restaurant_ids_dataframe 和restaurant_review_frame。
使用者嘗試利用 DataFrame.join() 方法使用business_id 欄位執行左連線。但是,由於列(business_id、stars 和 type)重疊,會出現錯誤。為了解決這個問題,我們可以使用 merge 函數:
import pandas as pd
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')
on參數指定用於聯接的欄位名稱,而how參數定義聯接類型(outer、inner、向左或向右)。在這種情況下,選擇外部作為兩個資料幀中鍵的並集。
請注意,兩個資料幀都包含名為 star 的欄位。預設情況下,合併作業會將後綴附加到列名稱(star_x 和 star_y)。要自訂這些後綴,我們可以使用suffixes 關鍵字參數:
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))
透過此修改,星級列將重新命名為star_restaurant_id 和star_restaurant_review。透過利用合併功能並適當地配置聯結類型和列後綴,我們可以根據共享的business_id列成功組合兩個資料框。
免責聲明: 提供的所有資源部分來自互聯網,如果有侵犯您的版權或其他權益,請說明詳細緣由並提供版權或權益證明然後發到郵箱:[email protected] 我們會在第一時間內為您處理。
Copyright© 2022 湘ICP备2022001581号-3