"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Pandas에서 숫자가 아닌 문자열에서 숫자를 추출하는 방법은 무엇입니까?

Pandas에서 숫자가 아닌 문자열에서 숫자를 추출하는 방법은 무엇입니까?

2024년 11월 10일에 게시됨
검색:437

How to Extract Numbers from Non-Numeric Strings in Pandas?

Pandas: 문자열에서 숫자 추출

Pandas에서 데이터 프레임으로 작업할 때 다음이 포함되지 않은 셀에서 숫자 정보를 추출해야 하는 경우가 많습니다. -숫자 문자. 이는 어려울 수 있지만 Pandas는 이를 달성하는 데 도움이 되는 여러 가지 방법을 제공합니다.

숫자 추출에 str.extract() 사용

숫자 추출을 위한 효과적인 방법 중 하나 문자열은 str.extract()입니다. 이 방법을 사용하면 캡처하려는 숫자 데이터를 정의하는 정규식 패턴을 지정할 수 있습니다.

다음 데이터 프레임을 고려하세요.

import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
                   })
print(df)

출력:

    A
0   1a
1   NaN
2   10a
3   100b
4   0b

각 셀에서 숫자를 추출하려면 다음 정규식을 사용할 수 있습니다.

df.A.str.extract('(\d )')

정규식 패턴(\d )은 하나 이상의 숫자 시퀀스를 캡처합니다. 패턴 주위의 괄호는 문자열의 일치하는 부분을 반환하는 데 사용되는 캡처링 그룹을 만듭니다.

출력:

0      1
1    NaN
2     10
3    100
4      0
Name: A, dtype: object

보시다시피 숫자가 아닌 문자가 포함된 셀도 포함하여 각 셀에서 원하는 숫자가 성공적으로 추출되었습니다. 이 방법은 정수에만 작동하고 부동 소수점 숫자에는 작동하지 않습니다.

릴리스 선언문 이 글은 1729736023에서 재인쇄되었습니다. 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3