并排比较数据帧以进行全面的变化分析
为了突出显示两个数据帧之间的差异,存在一种有效的方法,可以消除这种需要用于费力的逐行和逐列比较。通过利用特定的 Python Pandas 函数,可以查明各种数据类型(例如 int、float、boolean、string)的变化,并以直观的 HTML 表格格式呈现它们。
首先,确定是否存在任何变化使用布尔函数 (df1 != df2).any(1) 更改了行。接下来,要识别已更改的特定条目,请使用 ne_stacked = (df1 != df2).stack() 并使用changed = ne_stacked[ne_stacked].
过滤掉未更改的值以获得实际更改的值值,合并 Difference_locations = np.where(df1 != df2),它标识更改数据的位置。使用changed_from = df1.values[difference_locations]从这些位置的原始数据帧(df1)中提取值。类似地,使用changed_to = df2.values[difference_locations].
从第二个dataframe(df2)中提取相应的值。为了全面呈现差异,通过将changed_from和changed_to组合为列并设置索引来构造一个DataFrame以匹配更改的变量。此数据框将提供更改的清晰并排视图,突出显示每个数据点的原始值和更新值。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3