Compare DataFrames lado a lado para análise abrangente de alterações
Para destacar discrepâncias entre dois dataframes, existe um método eficiente que elimina a necessidade para comparações laboriosas linha por linha e coluna por coluna. Ao aproveitar funções específicas do Python Pandas, é possível identificar alterações em vários tipos de dados (por exemplo, int, float, boolean, string) e apresentá-las em um formato de tabela HTML intuitivo.
Para começar, estabeleça se há alguma. as linhas foram alteradas usando a função booleana (df1 != df2).any(1). Em seguida, para identificar entradas específicas que foram alteradas, use ne_stacked = (df1 != df2).stack() e filtre os valores não alterados utilizando alterado = ne_stacked[ne_stacked].
Para obter a alteração real valores, incorpore Difference_locations = np.where(df1 != df2), que identifica os locais dos dados alterados. Extraia os valores do dataframe original (df1) nesses locais usando change_from = df1.values[difference_locations]. Da mesma forma, extraia os valores correspondentes do segundo dataframe (df2) usando change_to = df2.values[difference_locations].
Para apresentar as diferenças de forma abrangente, construa um DataFrame combinando change_from e change_to como colunas e definindo o índice para corresponder à variável alterada. Este DataFrame fornecerá uma visão clara lado a lado das alterações, destacando os valores originais e atualizados para cada ponto de dados.
Isenção de responsabilidade: Todos os recursos fornecidos são parcialmente provenientes da Internet. Se houver qualquer violação de seus direitos autorais ou outros direitos e interesses, explique os motivos detalhados e forneça prova de direitos autorais ou direitos e interesses e envie-a para o e-mail: [email protected]. Nós cuidaremos disso para você o mais rápido possível.
Copyright© 2022 湘ICP备2022001581号-3