Pandas로 CSV를 가져오는 동안 행 건너뛰기
Pandas를 사용하여 CSV 데이터를 가져올 때 원하지 않는 행을 건너뛰어야 하는 경우가 많습니다. 분석에 포함시키세요. 그러나 Skiprows 인수를 둘러싼 모호성은 혼란스러울 수 있습니다.
skiprows의 구문은 다음과 같습니다:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
질문이 생깁니다. Pandas는 첫 번째 행을 건너뛸지 인덱스가 있는 행을 건너뛸지 어떻게 알 수 있나요? Skiprows=1이 지정된 경우 1입니까?
이 문제를 해결하기 위해 3개의 행이 있는 샘플 CSV 파일을 사용하여 실험을 수행해 보겠습니다.
1, 2 3, 4 5, 6
인덱스 1이 있는 행 건너뛰기
인덱스 1이 있는 행을 건너뛰려면 건너뛰기를 목록으로 전달하세요.
import pandas as pd
from io import StringIO
s = """1, 2
... 3, 4
... 5, 6"""
df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1
print(df)
출력:
0 1 0 1 2 1 5 6
행 개수 건너뛰기
특정 행 수(이 경우 1)를 건너뛰려면 건너뛰기를 정수로 전달합니다.
df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row
print(df)
출력:
0 1 0 3 4 1 5 6
따라서 Skiprows 인수는 목록을 제공하는지 정수를 제공하는지에 따라 다르게 동작하는 것이 분명합니다. 인덱스를 기준으로 행을 건너뛰려면 목록을 사용하세요. 그렇지 않으면 정수를 사용하여 파일 시작 부분에서 지정된 수의 행을 건너뜁니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3