Pydantic • 데이터 검증 및 삭제 처리

첫 장 > 프로그램 작성 > Pydantic • 데이터 검증 및 삭제 처리

Pydantic • 데이터 검증 및 삭제 처리

2024-08-19에 게시됨

검색:240

Pydantic • Dealing with validating and sanitizing data

프로그래밍을 시작한 이후 내 작업에는 보다 실용적이고 직접적인 솔루션이 필요했기 때문에 구조화되고 절차적인 패러다임을 주로 사용해 왔습니다. 데이터 추출 작업을 할 때 좀 더 체계적인 코드를 얻기 위해 새로운 패러다임으로 전환해야 했습니다.

스크래핑 작업 중에 처음에는 처리 방법을 알고 있었지만 갑자기 존재하지 않거나 캡처 중에 다른 유형으로 나타나는 특정 데이터를 캡처해야 하는 경우가 이러한 필요성의 예입니다. .

결과적으로 데이터가 int인지 문자열인지 확인하기 위해 if's 및 try and catch 블록을 추가해야 했습니다. 나중에 아무것도 캡처되지 않았음을 발견했습니다. None 등. 사전을 사용하여 다음과 같은 상황에서 흥미롭지 않은 "기본 데이터"를 저장하게 되었습니다.

data.get(값, 0)

data.get(values, 0)

음, 혼란스러운 오류 메시지는 확실히 더 이상 나타나지 않아야 했습니다.

이것이 Python이 역동적인 방식입니다. 변수는 작업 중인 유형에 대해 더 명확해질 때까지 원할 때마다 유형을 변경할 수 있습니다. 그런데 갑자기 많은 정보가 나타납니다. 이제 저는 IDE에서 유형 힌트와 흥미로운

pydantic 라이브러리를 사용하여 데이터 유효성 검사를 처리하는 방법에 대해 읽고 있습니다.

이제 데이터 조작과 같은 작업에서 새로운 패러다임을 사용하여 명시적으로 선언된 유형이 있는 객체와 이러한 유형의 유효성을 검사할 수 있는 라이브러리를 가질 수 있습니다. 문제가 발생하면 더 잘 설명된 오류 정보를 확인하면 디버그하기가 더 쉬워집니다.

피단틱

여기 Pydantic 문서가 있습니다. 더 궁금한 사항은 언제나 상담을 받아보시는 것이 좋습니다.

기본적으로 우리가 이미 알고 있듯이 다음으로 시작합니다.

pip 설치 pydantic

data.get(values, 0)

그런 다음 가정적으로 이러한 이메일이 포함된 소스에서 이메일을 캡처하려고 하며 대부분은 "[email protected]"과 같습니다. 그러나 때로는 "xxxx@" 또는 "xxxx"와 같은 형태로 나타날 수도 있습니다. 우리는 캡처해야 하는 이메일 형식에 대해 의심의 여지가 없으므로 Pydantic을 사용하여 이 이메일 문자열을 검증할 것입니다:

pydantic import BaseModel, EmailStr에서 클래스 소비자(BaseModel): 이메일: EmailStr account_id: 정수 소비자 = 소비자(email="teste@teste", account_id=12345) 인쇄(소비자)

data.get(values, 0)

pip install pydantic[email]과 함께 설치된 선택적 종속성 "email-validator"를 사용했다는 점에 유의하세요. 우리가 알고 있듯이 코드를 실행하면 잘못된 이메일 형식 "teste@teste":

로 오류가 발생합니다.

추적(가장 최근 호출 마지막): ... 소비자 = 소비자(email="teste@teste", account_id=12345) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ ...: 소비자에 대한 유효성 검사 오류 1개 이메일 값은 유효한 이메일 주소가 아닙니다. @-기호 뒤의 부분이 유효하지 않습니다. 마침표가 있어야 합니다. [유형=값_오류, 입력_값='teste@teste', 입력_유형=str]

data.get(values, 0)

선택적 종속성을 사용하여 데이터를 검증하는 것은 자체 검증을 생성하는 것과 마찬가지로 흥미롭고 Pydantic은

field_validator를 통해 이를 허용합니다. 따라서 우리는 account_id가 양수이고 0보다 커야 한다는 것을 알고 있습니다. 다르다면 Pydantic이 예외, 즉 값 오류가 있음을 경고하는 것이 흥미로울 것입니다. 그러면 코드는 다음과 같습니다:

pydantic import BaseModel, EmailStr, field_validator에서 클래스 소비자(BaseModel): 이메일: EmailStr account_id: 정수 @field_validator("account_id") def verify_account_id(cls, 값): """사용자 정의 필드 유효성 검사""" 값 from pydantic import BaseModel, EmailStr, field_validator class Consumer(BaseModel): email: EmailStr account_id: int @field_validator("account_id") def validate_account_id(cls, value): """Custom Field Validation""" if value $ 파이썬 Capture_emails.py 역추적(가장 최근 호출 마지막): ... 소비자 = 소비자(email="[email protected]", account_id=0) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ ...: 소비자에 대한 유효성 검사 오류 1개 account_id 값 오류, account_id는 양수여야 합니다. 0 [type=value_error, input_value=0, input_type=int] 자세한 내용은 https://errors.pydantic.dev/2.8/v/value_error를 참조하세요.

data.get(values, 0)

이제 올바른 값으로 코드를 실행합니다.

data.get(values, 0)

오른쪽?!

또한 좀 더 간단하고 Pydantic과 일부 유사점이 있는 기본 "dataclasses" 모듈에 대한 내용도 읽었습니다. 그러나 검증이 필요한 더 복잡한 데이터 모델을 처리하는 데에는 Pydantic이 더 좋습니다. 데이터 클래스는 Python에 기본적으로 포함되어 있었지만 Pydantic은 적어도 아직은 포함되어 있지 않습니다.

릴리스 선언문 이 글은 https://dev.to/evertontenorio/pydantic-dealing-with-validating-and-sanitizing-data-594p?1에서 복제됩니다.1 침해 내용이 있는 경우, [email protected]으로 연락하여 삭제하시기 바랍니다.

최신 튜토리얼 더>

Hexabot 설정 및 비주얼 편집기 튜토리얼: 첫 번째 AI Chatbot 구축
챗봇 매니아 여러분, 안녕하세요! 이 튜토리얼에서는 오픈 소스 AI 챗봇 빌더인 Hexabot을 설정하고 사용하는 과정을 안내합니다. 먼저 GitHub 저장소 복제, 종속성 설치, Hexabot용 환경 변수 구성부터 시작하겠습니다. 또한 Docker를 사용하여 프로젝트...

프로그램 작성 2024-11-02에 게시됨
mysql_fetch_row(), mysql_fetch_assoc() 및 mysql_fetch_array(): 어느 것을 선택해야 합니까?
mysql_fetch_row(), mysql_fetch_assoc() 및 mysql_fetch_array() 설명됨배경:사용되지 않는 MySQL 확장을 사용하면 결과 집합에서 데이터를 검색하기 위해 mysql_fetch_row(), mysql_fetch_assoc() ...

프로그램 작성 2024-11-02에 게시됨
Next.js - 개요
이 글은 초보자에게 친숙한 가이드이자 Next.js 작업 단계를 제공합니다. Next.js는 웹 애플리케이션 구축을 위한 유연한 프레임워크입니다. 오히려 Node.js 위에 구축된 반응 프레임워크입니다. Next.js 프로젝트 설정 새로운 Next.js 프로젝트를 시작...

프로그램 작성 2024-11-02에 게시됨
코드에서 Unsplash 이미지를 사용하는 방법
새로운 SaaS 프로젝트를 진행하는 개발자로서 저는 일부 Unsplash 이미지를 해당 URL을 통해 직접 연결해야 했습니다. 처음에는 https://source.unsplash.com/ API 사용을 권장하는 기사(링크)를 접했습니다. 그러나 이 방법은 더 이상 작...

프로그램 작성 2024-11-02에 게시됨
연관 배열을 병합하고, 누락된 키를 처리하고, 기본값으로 채우는 방법은 무엇입니까?
여러 연관 배열을 병합하고 누락된 열을 기본값으로 추가연관 배열을 다양한 키 세트와 결합하여 통합 배열을 만드는 것은 어려울 수 있습니다. 이 질문은 이를 달성하는 방법을 탐색하며 원하는 출력은 키가 병합되고 누락된 열이 기본값으로 채워지는 배열입니다.이를 달성하려면 ...

프로그램 작성 2024-11-02에 게시됨
testcontainers-go 및 docker-compose로 테스트 스위트 활용
Welcome back, folks! Today, we will cover the end-to-end tests in an intriguing blog post. If you've never written these kinds of tests or if you stri...

프로그램 작성 2024-11-02에 게시됨
귀하의 기사에 적합한 몇 가지 질문 기반 제목은 다음과 같습니다. **직접적이고 간결함:** * **Windows 콘솔에서 UTF-8 문자를 올바르게 표시하는 방법은 무엇입니까?** * **기존 방법이 디스플레이에 실패하는 이유
Windows 콘솔에서 UTF-8 문자를 올바르게 표시기존 방법을 사용하여 Windows 콘솔에서 UTF-8 문자를 표시하려는 많은 시도가 실패했습니다. 확장 문자를 올바르게 렌더링합니다.실패한 시도:MultiByteToWideChar() 및 wprintf()를 사용하...

프로그램 작성 2024-11-02에 게시됨
ReactJS에 대한 모의 소개
ReactJS 19: 중요한 부분 동시 모드 개선 사항: ReactJS 19의 가장 큰 개선 사항은 Concurrent 모드로 이루어졌습니다. Concurrent 모드는 애플리케이션이 자체적으로 업데이트되는 동안 UI를 부드럽고 반응적으로 유지할 뿐만 아...

프로그램 작성 2024-11-02에 게시됨
첫 번째 DEV 웹 게임 챌린지 심사
저는 9월에 DEV 팀이 주관한 첫 번째 웹 게임 챌린지에 제출된 출품작을 심사해 달라는 요청을 받았으며 결과는 10월 초에 발표되었습니다. 우리는 몇 달 동안 DEV에서 챌린지(미니 해커톤)를 조직해 왔으며, 첫 번째 웹 게임 챌린지를 발표할 계획입니다. 귀하의 전문...

프로그램 작성 2024-11-02에 게시됨
검증된 현금 앱 계좌 구매: 안전하고 신뢰할 수 있는 거래
Buying verified Cash App accounts is not recommended. It can lead to security risks and potential account bans. If you want to more information just k...

프로그램 작성 2024-11-02에 게시됨
`std::function`에 동등 비교가 부족한 이유는 무엇입니까?
std::function의 평등 비교 수수께끼 풀기수수께끼:std::function이 왜, 동등 비교 기능이 부여되지 않은 최신 C 코드베이스의 필수 구성 요소입니까? 이 질문은 처음부터 프로그래머를 당황하게 하여 호출 가능한 개체 컬렉션을 관리하는 데 혼란과 어려움을...

프로그램 작성 2024-11-02에 게시됨
JavaScript 유형 검사 | 프로그래밍 튜토리얼
소개 이 문서에서는 다음과 같은 기술을 다룹니다. 이 실습에서는 제공된 값이 지정된 유형인지 확인하는 JavaScript 함수를 살펴보겠습니다. 생성자 속성과 Array.prototype.includes() 메서드를 활용하여 값이 지정된 유형인지 확인하...

프로그램 작성 2024-11-02에 게시됨
Streamlit을 사용하여 웹앱으로 기계 학습 모델 배포
소개 기계 학습 모델은 기본적으로 데이터에서 예측을 하거나 패턴을 찾는 데 사용되는 규칙 또는 메커니즘의 집합입니다. 매우 간단하게 말하면(과도하게 단순화할 염려 없이) Excel에서 최소 제곱법을 사용하여 계산된 추세선도 모델입니다. 그러나 실제 응용...

프로그램 작성 2024-11-02에 게시됨
## utf8_unicode_ci 대 utf8_bin: 독일 웹사이트에 가장 적합한 MySQL 데이터 정렬은 무엇입니까?
독일어에 대한 최적의 MySQL 데이터 정렬 선택독일어 사용자를 위한 웹사이트를 디자인할 때는 ä, ü, 그리고 ß. 언어별 요구 사항에 있어서 대조 선택은 중요한 역할을 합니다.문자 집합 및 대조문자 처리의 경우 UTF-8이 여전히 선호됩니다. 옵션으로 광범위한 문자...

프로그램 작성 2024-11-02에 게시됨
예외 처리 기본 사항
Java의 예외 처리는 try, catch, throw, throws 및 finally의 5가지 키워드로 관리됩니다. 이러한 키워드는 상호 연결된 하위 시스템을 형성합니다. 모니터링할 명령은 try 블록 내부에 있습니다. try 블록에서 예외가 발생하면 예외가 발생합...

프로그램 작성 2024-11-02에 게시됨