"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > Pydantic • 데이터 검증 및 삭제 처리

Pydantic • 데이터 검증 및 삭제 처리

2024-08-19에 게시됨
검색:240

Pydantic • Dealing with validating and sanitizing data

프로그래밍을 시작한 이후 내 작업에는 보다 실용적이고 직접적인 솔루션이 필요했기 때문에 구조화되고 절차적인 패러다임을 주로 사용해 왔습니다. 데이터 추출 작업을 할 때 좀 더 체계적인 코드를 얻기 위해 새로운 패러다임으로 전환해야 했습니다.

스크래핑 작업 중에 처음에는 처리 방법을 알고 있었지만 갑자기 존재하지 않거나 캡처 중에 다른 유형으로 나타나는 특정 데이터를 캡처해야 하는 경우가 이러한 필요성의 예입니다. .

결과적으로 데이터가 int인지 문자열인지 확인하기 위해 if'stry and catch 블록을 추가해야 했습니다. 나중에 아무것도 캡처되지 않았음을 발견했습니다. None 등. 사전을 사용하여 다음과 같은 상황에서 흥미롭지 않은 "기본 데이터"를 저장하게 되었습니다.

data.get(값, 0)
data.get(values, 0)
음, 혼란스러운 오류 메시지는 확실히 더 이상 나타나지 않아야 했습니다.

이것이 Python이 역동적인 방식입니다. 변수는 작업 중인 유형에 대해 더 명확해질 때까지 원할 때마다 유형을 변경할 수 있습니다. 그런데 갑자기 많은 정보가 나타납니다. 이제 저는 IDE에서 유형 힌트와 흥미로운

pydantic 라이브러리를 사용하여 데이터 유효성 검사를 처리하는 방법에 대해 읽고 있습니다.

이제 데이터 조작과 같은 작업에서 새로운 패러다임을 사용하여 명시적으로 선언된 유형이 있는 객체와 이러한 유형의 유효성을 검사할 수 있는 라이브러리를 가질 수 있습니다. 문제가 발생하면 더 잘 설명된 오류 정보를 확인하면 디버그하기가 더 쉬워집니다.


피단틱

여기 Pydantic 문서가 있습니다. 더 궁금한 사항은 언제나 상담을 받아보시는 것이 좋습니다.

기본적으로 우리가 이미 알고 있듯이 다음으로 시작합니다.


pip 설치 pydantic
data.get(values, 0)
그런 다음 가정적으로 이러한 이메일이 포함된 소스에서 이메일을 캡처하려고 하며 대부분은 "[email protected]"과 같습니다. 그러나 때로는 "xxxx@" 또는 "xxxx"와 같은 형태로 나타날 수도 있습니다. 우리는 캡처해야 하는 이메일 형식에 대해 의심의 여지가 없으므로 Pydantic을 사용하여 이 이메일 문자열을 검증할 것입니다:


pydantic import BaseModel, EmailStr에서 클래스 소비자(BaseModel): 이메일: EmailStr account_id: 정수 소비자 = 소비자(email="teste@teste", account_id=12345) 인쇄(소비자)
data.get(values, 0)
pip install pydantic[email]과 함께 설치된 선택적 종속성 "email-validator"를 사용했다는 점에 유의하세요. 우리가 알고 있듯이 코드를 실행하면 잘못된 이메일 형식 "teste@teste":

로 오류가 발생합니다.

추적(가장 최근 호출 마지막): ... 소비자 = 소비자(email="teste@teste", account_id=12345) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ ...: 소비자에 대한 유효성 검사 오류 1개 이메일 값은 유효한 이메일 주소가 아닙니다. @-기호 뒤의 부분이 유효하지 않습니다. 마침표가 있어야 합니다. [유형=값_오류, 입력_값='teste@teste', 입력_유형=str]
data.get(values, 0)
선택적 종속성을 사용하여 데이터를 검증하는 것은 자체 검증을 생성하는 것과 마찬가지로 흥미롭고 Pydantic은

field_validator를 통해 이를 허용합니다. 따라서 우리는 account_id가 양수이고 0보다 커야 한다는 것을 알고 있습니다. 다르다면 Pydantic이 예외, 즉 값 오류가 있음을 경고하는 것이 흥미로울 것입니다. 그러면 코드는 다음과 같습니다:

pydantic import BaseModel, EmailStr, field_validator에서 클래스 소비자(BaseModel): 이메일: EmailStr account_id: 정수 @field_validator("account_id") def verify_account_id(cls, 값): """사용자 정의 필드 유효성 검사""" 값 from pydantic import BaseModel, EmailStr, field_validator class Consumer(BaseModel): email: EmailStr account_id: int @field_validator("account_id") def validate_account_id(cls, value): """Custom Field Validation""" if value $ 파이썬 Capture_emails.py 역추적(가장 최근 호출 마지막): ... 소비자 = 소비자(email="[email protected]", account_id=0) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ ...: 소비자에 대한 유효성 검사 오류 1개 account_id 값 오류, account_id는 양수여야 합니다. 0 [type=value_error, input_value=0, input_type=int] 자세한 내용은 https://errors.pydantic.dev/2.8/v/value_error를 참조하세요.
data.get(values, 0)
이제 올바른 값으로 코드를 실행합니다.


pydantic import BaseModel, EmailStr, field_validator에서 클래스 소비자(BaseModel): 이메일: EmailStr account_id: 정수 @field_validator("account_id") def verify_account_id(cls, 값): """사용자 정의 필드 유효성 검사""" 값 from pydantic import BaseModel, EmailStr, field_validator class Consumer(BaseModel): email: EmailStr account_id: int @field_validator("account_id") def validate_account_id(cls, value): """Custom Field Validation""" if value $ 파이썬 Capture_emails.py 이메일='[email protected]' account_id=12345
data.get(values, 0)
오른쪽?!

또한 좀 더 간단하고 Pydantic과 일부 유사점이 있는 기본 "dataclasses" 모듈에 대한 내용도 읽었습니다. 그러나 검증이 필요한 더 복잡한 데이터 모델을 처리하는 데에는 Pydantic이 더 좋습니다. 데이터 클래스는 Python에 기본적으로 포함되어 있었지만 Pydantic은 적어도 아직은 포함되어 있지 않습니다.

릴리스 선언문 이 글은 https://dev.to/evertontenorio/pydantic-dealing-with-validating-and-sanitizing-data-594p?1에서 복제됩니다.1 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3