프로그래밍을 시작한 이후 내 작업에는 보다 실용적이고 직접적인 솔루션이 필요했기 때문에 구조화되고 절차적인 패러다임을 주로 사용해 왔습니다. 데이터 추출 작업을 할 때 좀 더 체계적인 코드를 얻기 위해 새로운 패러다임으로 전환해야 했습니다.
스크래핑 작업 중에 처음에는 처리 방법을 알고 있었지만 갑자기 존재하지 않거나 캡처 중에 다른 유형으로 나타나는 특정 데이터를 캡처해야 하는 경우가 이러한 필요성의 예입니다. .
결과적으로 데이터가 int인지 문자열인지 확인하기 위해 if's 및 try and catch 블록을 추가해야 했습니다. 나중에 아무것도 캡처되지 않았음을 발견했습니다. None 등. 사전을 사용하여 다음과 같은 상황에서 흥미롭지 않은 "기본 데이터"를 저장하게 되었습니다.
data.get(values, 0)음, 혼란스러운 오류 메시지는 확실히 더 이상 나타나지 않아야 했습니다.
이것이 Python이 역동적인 방식입니다. 변수는 작업 중인 유형에 대해 더 명확해질 때까지 원할 때마다 유형을 변경할 수 있습니다. 그런데 갑자기 많은 정보가 나타납니다. 이제 저는 IDE에서 유형 힌트와 흥미로운
pydantic 라이브러리를 사용하여 데이터 유효성 검사를 처리하는 방법에 대해 읽고 있습니다.
이제 데이터 조작과 같은 작업에서 새로운 패러다임을 사용하여 명시적으로 선언된 유형이 있는 객체와 이러한 유형의 유효성을 검사할 수 있는 라이브러리를 가질 수 있습니다. 문제가 발생하면 더 잘 설명된 오류 정보를 확인하면 디버그하기가 더 쉬워집니다.
기본적으로 우리가 이미 알고 있듯이 다음으로 시작합니다.
data.get(values, 0)그런 다음 가정적으로 이러한 이메일이 포함된 소스에서 이메일을 캡처하려고 하며 대부분은 "[email protected]"과 같습니다. 그러나 때로는 "xxxx@" 또는 "xxxx"와 같은 형태로 나타날 수도 있습니다. 우리는 캡처해야 하는 이메일 형식에 대해 의심의 여지가 없으므로 Pydantic을 사용하여 이 이메일 문자열을 검증할 것입니다:
data.get(values, 0)pip install pydantic[email]과 함께 설치된 선택적 종속성 "email-validator"를 사용했다는 점에 유의하세요. 우리가 알고 있듯이 코드를 실행하면 잘못된 이메일 형식 "teste@teste":
로 오류가 발생합니다.
data.get(values, 0)선택적 종속성을 사용하여 데이터를 검증하는 것은 자체 검증을 생성하는 것과 마찬가지로 흥미롭고 Pydantic은
field_validator를 통해 이를 허용합니다. 따라서 우리는 account_id가 양수이고 0보다 커야 한다는 것을 알고 있습니다. 다르다면 Pydantic이 예외, 즉 값 오류가 있음을 경고하는 것이 흥미로울 것입니다. 그러면 코드는 다음과 같습니다:
data.get(values, 0)이제 올바른 값으로 코드를 실행합니다.
data.get(values, 0)오른쪽?!
또한 좀 더 간단하고 Pydantic과 일부 유사점이 있는 기본 "dataclasses" 모듈에 대한 내용도 읽었습니다. 그러나 검증이 필요한 더 복잡한 데이터 모델을 처리하는 데에는 Pydantic이 더 좋습니다. 데이터 클래스는 Python에 기본적으로 포함되어 있었지만 Pydantic은 적어도 아직은 포함되어 있지 않습니다.
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3