Pandas로 CSV를 가져오는 동안 행 건너뛰기
pandas.read_csv()를 사용하여 CSV 데이터를 가져올 때 특정 행을 건너뛸 수 있습니다. . 그러나 Skiprows 매개변수는 목록과 정수를 모두 허용하므로 혼동될 수 있습니다.
skiprows 매개변수를 사용하면 파일 시작 부분에서 건너뛸 행을 지정할 수 있습니다. 행 번호 목록을 제공하면 해당 행을 건너뜁니다. 정수를 제공하면 해당 행 수를 건너뜁니다.
예를 들어 두 번째 행에 불필요한 데이터가 포함된 CSV 파일이 있고 이를 건너뛰려는 경우 다음 중 하나를 사용할 수 있습니다. 방법:
목록으로 건너뛰기(권장)
import pandas as pd
from io import StringIO
s = """1, 2
3, 4
5, 6"""
# Skip the second row using a list
df = pd.read_csv(StringIO(s), skiprows=[1], header=None)
# Output: Row with index 1 skipped
print(df)
정수로 건너뛰기
# Skip the second row using an integer
df = pd.read_csv(StringIO(s), skiprows=1, header=None)
# Output: Row with index 1 skipped
print(df)
skirows=1을 사용하면 첫 번째 행을 건너뛰고, Skiprows=[1]을 사용하면 인덱스 1이 있는 행을 건너뜁니다. 이는 Python이 0 기반 인덱싱을 사용하기 때문입니다. 목록의 인덱스는 0입니다.
결론
skiprows 매개변수의 동작을 이해하면 다음을 효과적으로 수행할 수 있습니다. Pandas를 사용하여 CSV를 가져오는 동안 원하지 않는 행을 건너뜁니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3