"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > 심층적인 변경 분석을 위해 DataFrame을 나란히 효율적으로 비교하는 방법은 무엇입니까?

심층적인 변경 분석을 위해 DataFrame을 나란히 효율적으로 비교하는 방법은 무엇입니까?

2024-11-01에 게시됨
검색:882

How to Efficiently Compare DataFrames Side-by-Side for In-depth Change Analysis?

포괄적인 변경 분석을 위해 데이터 프레임을 나란히 비교

두 데이터 프레임 간의 불일치를 강조하기 위해 필요 없는 효율적인 방법이 있습니다. 힘든 행별 및 열별 비교를 위해. 특정 Python Pandas 기능을 활용하면 다양한 데이터 유형(예: int, float, boolean, string)에서 변경 사항을 정확히 찾아내고 이를 직관적인 HTML 테이블 형식으로 표시할 수 있습니다.

시작하려면 변경 사항이 있는지 확인하세요. 부울 함수(df1 != df2).any(1)를 사용하여 행이 변경되었습니다. 다음으로, 변경된 특정 항목을 식별하려면 ne_stacked = (df1 != df2).stack()을 사용하고 변경 = ne_stacked[ne_stacked]를 활용하여 변경되지 않은 값을 필터링합니다.

실제 변경 내용을 얻으려면 값에 변경된 데이터의 위치를 ​​식별하는 Difference_locations = np.where(df1 != df2)를 통합합니다. Change_from = df1.values[difference_locations]를 사용하여 이러한 위치의 원래 데이터 프레임(df1)에서 값을 추출합니다. 마찬가지로, selected_to = df2.values[difference_locations].

를 사용하여 두 번째 데이터프레임(df2)에서 해당 값을 추출합니다. 차이점을 종합적으로 표현하려면 변경된_from과 변경된_to를 열로 결합하고 인덱스를 설정하여 DataFrame을 구성합니다. 변경된 변수와 일치합니다. 이 DataFrame은 변경 사항을 명확하게 나란히 표시하여 각 데이터 포인트의 원래 값과 업데이트된 값을 모두 강조 표시합니다.

릴리스 선언문 이 글은 1729598716에서 재인쇄되었습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3