오류 이해: "ValueError: 중복 축에서 다시 색인을 생성할 수 없습니다."
pandas에서 "ValueError: 중복 축에서 색인을 다시 생성할 수 없습니다. 중복 값이 포함된 축을 따라 데이터를 다시 색인화하거나 할당하려고 할 때 "축"이 발생했습니다. 이 문제는 중복된 인덱스 값이 있는 열/행에 데이터를 조인하거나 할당할 때 발생합니다.
예제에 개념 적용
제공된 예에서 사용자는 은(는) 인덱스 값 'sums'를affinity_matrix DataFrame의 모든 열의 합계로 설정하려고 합니다. 그러나 주어진 코드 조각에 표시되지 않은 Affinity_matrix.columns에 중복 값이 있기 때문에 오류가 발생합니다.
이 중복 값은 열을 따라 데이터를 다시 색인화하거나 할당하려고 할 때 충돌을 일으킵니다. 중심선. 이 문제를 해결하려면 해당 작업을 수행하기 전에 DataFrame의 인덱스 값이 고유한지 확인해야 합니다.
간단한 예제로 테스트
간단한 예제를 사용하겠습니다. 오류를 더 자세히 설명하는 예:
import pandas as pd
import numpy as np
a = np.arange(35).reshape(5, 7)
df = pd.DataFrame(a, ['x', 'y', 'u', 'z', 'w'], range(10, 17))
df.loc['sums'] = df.sum(axis=0) # Assume that 'sums' is already an index value
# This would result in the ValueError, as 'sums' is a duplicate index value
DataFrame 'df'의 행에 이미 인덱스 값 'sums'가 있고 새 인덱스 값을 생성하려고 시도하기 때문에 오류가 발생합니다. 이름이 같은 인덱스 값으로 인해 축이 중복됩니다.
결론
"ValueError: 중복 축에서 다시 색인을 생성할 수 없습니다." 오류는 고유성을 보장하기 위한 알림 역할을 합니다. DataFrame의 인덱스 값. 그렇게 하지 않으면 데이터 재인덱싱이나 할당과 같은 특정 축을 따라 작업을 수행할 때 문제가 발생할 수 있습니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3