"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Pandas Read_csv를 사용하여 불규칙한 분리기를 사용하여 데이터를 구문 분석합니다

Pandas Read_csv를 사용하여 불규칙한 분리기를 사용하여 데이터를 구문 분석합니다

2025-04-16에 게시되었습니다
검색:147

How Do I Parse Data with Irregular Separators in Pandas read_csv?

또는 Python Split () 메소드와 유사하게 작동하는 Delim_WhitEspace 매개 변수를 활용할 수 있습니다. Delim_WhitEspace를 True로 설정함으로써 Pandas는 모든 공백 (공백 및 탭 포함)을 분리기로 취급합니다. 이렇게하면 특정 Regex 패턴을 지정할 필요가 없습니다.

다음 예를 고려하십시오. data = pd.read_csv ( "irregular_separators.csv", header = none, delimiter = r "\ s") 인쇄 (데이터) # 출력 : # 0 1 2 3 4 # 0 A B C 1 2 # 1 d e f 3 4

이 경우 irregular_separators.csv에는 탭, 공백 및 두 가지 조합으로 구분 된 열이 포함되어 있습니다. Regex Pattern을 지정하여 Read_csv는 데이터를 성공적으로 구문 분석하고 데이터 프레임을 생성합니다.

또는 delim_whitespace를 사용하여 :

data = pd.read_csv ( "irregular_separators.csv", header = none, true). 인쇄 (데이터) # 출력 (위와 동일) : # 0 1 2 3 4 # 0 A B C 1 2 # 1 d e f 3 4

read_csv에서 분리기의 유연성을 활용하여 데이터 파일에서 불규칙한 공백을 효과적으로 처리하고 분석을 위해 의미있는 정보를 추출 할 수 있습니다.

릴리스 선언문 이 기사는 1729556177에 재현됩니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3