Combinación de marcos de datos de Pandas: unirse en una columna común
La unión es una operación esencial para fusionar marcos de datos basados en atributos comunes. Esta pregunta examina el problema de combinar dos marcos de datos de pandas: restaurant_ids_dataframe y restaurant_review_frame.
El usuario intenta utilizar el método DataFrame.join() para realizar una unión izquierda usando la columna business_id. Sin embargo, se produce un error debido a columnas superpuestas (business_id, estrellas y tipo). Para resolver este problema, podemos emplear la función de combinación:
import pandas as pd
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer')
El parámetro on especifica el nombre del campo utilizado para unirse, mientras que el parámetro how define el tipo de unión (externa, interna, izquierda o derecha). En este caso, se selecciona exterior para una unión de claves de ambos marcos de datos.
Tenga en cuenta que ambos marcos de datos contienen una columna llamada estrellas. De forma predeterminada, la operación de combinación agrega sufijos a los nombres de las columnas (star_x y star_y). Para personalizar estos sufijos, podemos usar el argumento de palabra clave sufijos:
pd.merge(restaurant_ids_dataframe, restaurant_review_frame, on='business_id', how='outer', suffixes=('_restaurant_id', '_restaurant_review'))
Con esta modificación, las columnas de estrellas pasarán a llamarse star_restaurant_id y estrella_restaurante_review. Al aprovechar la función de combinación y configurar adecuadamente el tipo de unión y los sufijos de columna, podemos combinar con éxito los dos marcos de datos en función de su columna business_id compartida.
Descargo de responsabilidad: Todos los recursos proporcionados provienen en parte de Internet. Si existe alguna infracción de sus derechos de autor u otros derechos e intereses, explique los motivos detallados y proporcione pruebas de los derechos de autor o derechos e intereses y luego envíelos al correo electrónico: [email protected]. Lo manejaremos por usted lo antes posible.
Copyright© 2022 湘ICP备2022001581号-3