juntando os frutos de dados com base nos intervalos de valor da coluna
no contexto fornecido, temos dois dados de dados, df_1 e df_2, onde precisamos de derrotá -los e como o timestamp rum na df_1 na queda de df_1 e df_2.
Uma abordagem para conseguir isso é criando um índice de intervalo a partir das colunas iniciantes e finais em DF_2. Em seguida, podemos usar o método get_loc para obter o evento correspondente para cada registro de data e hora em DF_1. Aqui está o código Python para esta solução:
# Create interval index from df_2 df_2.index = pd.IntervalIndex.from_arrays(df_2['start'], df_2['end'], closed='both') # Get corresponding event for each timestamp in df_1 df_1['event'] = df_1['timestamp'].apply(lambda x: df_2.iloc[df_2.index.get_loc(x)]['event'])
isso criará uma nova coluna denominada Evento em DF_1, que contém os eventos correspondentes para cada momento de tempo de cada O DataFrame de dados ingressado resultante conterá as seguintes colunas:
timestamp A B event
A saída será semelhante a:
timestamp A B event 0 2016-05-14 10:54:33 0.020228 0.026572 E1 1 2016-05-14 10:54:34 0.057780 0.175499 E2 2 2016-05-14 10:54:35 0.098808 0.620986 E2 3 2016-05-14 10:54:36 0.158789 1.014819 E2 4 2016-05-14 10:54:39 0.038129 2.384590 E3
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3