Rejoindre des dataframes basés sur les plages de valeur de colonne
dans le contexte donné, nous avons deux dataframes, df_1 et df_2, où nous devons les fusionner dans les colonnes Times DF_2.
Une approche pour y parvenir est en créant un index d'intervalle à partir des colonnes Start and End dans DF_2. Nous pouvons ensuite utiliser la méthode get_loc pour obtenir l'événement correspondant pour chaque horodatage dans DF_1. Voici le code Python pour cette solution:
# Create interval index from df_2 df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both') # Get corresponding event for each timestamp in df_1 df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])
Ceci créera une nouvelle colonne nommée dans DF_1, qui conteste les événements correspondants pour chaque timestamp qui tombe dans le DF_1 Spécifié dans DF_2. Le DataFrame joint résultant contiendra les colonnes suivantes:
timestamp A B event
Clause de non-responsabilité: Toutes les ressources fournies proviennent en partie d'Internet. En cas de violation de vos droits d'auteur ou d'autres droits et intérêts, veuillez expliquer les raisons détaillées et fournir une preuve du droit d'auteur ou des droits et intérêts, puis l'envoyer à l'adresse e-mail : [email protected]. Nous nous en occuperons pour vous dans les plus brefs délais.
Copyright© 2022 湘ICP备2022001581号-3