соединение DataFrames на основе диапазонов значений столбца
в данном контексте у нас есть два фрейма Data, DF_1 и DF_2, где нам нужно объединить их, чтобы в столбце Timemest в DF_1 в рамках начала и заканчиваются столбцы в столбцах в заканчиваниях в столбцах. df_2.
один подход к достижению этого - создать индекс интервалов из столбцов начала и конечного в DF_2. Затем мы можем использовать метод GET_LOC для получения соответствующего события для каждой метки времени в DF_1. Вот код Python для этого решения:
# Create interval index from df_2 df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both') # Get corresponding event for each timestamp in df_1 df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])
это создаст новую колонку с именем события в DF_1, который содержит соответствующие события для каждого Timestam Полученный соединенный DataFrame будет содержать следующие столбцы:
timestamp A B event
] Вывод будет выглядеть аналогичным:
timestamp A B event 0 2016-05-14 10:54:33 0.020228 0.026572 E1 1 2016-05-14 10:54:34 0.057780 0.175499 E2 2 2016-05-14 10:54:35 0.098808 0.620986 E2 3 2016-05-14 10:54:36 0.158789 1.014819 E2 4 2016-05-14 10:54:39 0.038129 2.384590 E3]
Отказ от ответственности: Все предоставленные ресурсы частично взяты из Интернета. В случае нарушения ваших авторских прав или других прав и интересов, пожалуйста, объясните подробные причины и предоставьте доказательства авторских прав или прав и интересов, а затем отправьте их по электронной почте: [email protected]. Мы сделаем это за вас как можно скорее.
Copyright© 2022 湘ICP备2022001581号-3