Объединение фреймов данных Pandas: объединение по общему столбцу
Объединение — это важная операция для объединения фреймов данных на основе общих атрибутов. В этом вопросе рассматривается проблема объединения двух фреймов данных pandas: Restaurant_ids_dataframe и Restaurant_review_frame.
Пользователь пытается использовать метод DataFrame.join() для выполнения левого соединения с использованием столбца business_id. Однако возникает ошибка из-за перекрытия столбцов (business_id, звездочки и тип). Чтобы решить эту проблему, мы можем вместо этого использовать функцию слияния:
import pandas as pd
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')
Параметр on указывает имя поля, используемого для объединения, а параметр How определяет тип соединения (внешнее, внутреннее, влево или вправо). В этом случае для объединения ключей из обоих фреймов данных выбирается внешний.
Обратите внимание, что оба фрейма данных содержат столбец с именем stars. По умолчанию операция слияния добавляет суффиксы к именам столбцов (star_x и star_y). Чтобы настроить эти суффиксы, мы можем использовать аргумент ключевого слова suffixes:
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))
Благодаря этому изменению столбцы со звездочками будут переименованы в star_restaurant_id и star_restaurant_review. Используя функцию слияния и соответствующим образом настроив тип соединения и суффиксы столбцов, мы можем успешно объединить два фрейма данных на основе их общего столбца business_id.
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3