백엔드 엔지니어로서 우리는 각각 고유한 식별이 필요한 수많은 리소스, 사용자 및 엔터티를 확장하고 처리할 수 있는 시스템을 구축하는 임무를 맡는 경우가 많습니다. 대부분의 경우 순차 ID(예: 1, 2, 3)를 사용하는 것은 간단한 해결책처럼 보이지만 애플리케이션이 분산 시스템 전반에 걸쳐 성장하고 확장되면 문제가 될 수 있습니다. 이것이 UUID(Universally Unique Identifiers)가 들어오는 곳입니다.
이 블로그 게시물에서 살펴볼 내용은 다음과 같습니다.
UUID(Universally Unique Identifier)는 컴퓨터 시스템에서 정보를 고유하게 식별하는 데 사용되는 128비트 숫자입니다. 이는 전역적으로 고유하도록 설계되었습니다. 즉, 서로 다른 시스템에서 독립적으로 생성된 UUID가 충돌하지 않는다는 의미입니다.
UUID는 다음과 같습니다:
66e69275-c6bc-800c-90a6-2f41cb991502
32개의 16진수 숫자로 구성되며 8-4-4-4-12 형식으로 하이픈으로 구분된 5개 그룹으로 표시됩니다.
분산 시스템의 데이터베이스 키: 서로 다른 데이터베이스나 마이크로서비스가 서로 통신하지 않고 고유한 ID를 생성해야 하는 시스템에서 UUID는 고유성을 보장합니다. 예를 들어, 분산형 전자상거래 플랫폼에서 각 서비스는 독립적으로 주문 또는 거래 ID를 생성할 수 있으며 UUID는 충돌을 방지합니다.
세션 ID: UUID는 일반적으로 웹 애플리케이션에서 사용자 세션을 식별하는 데 사용됩니다. 민감하거나 예측 가능한 데이터를 유출하지 않고 세션 정보를 유지해야 할 때 특히 유용합니다.
파일 또는 리소스 식별자: 다양한 플랫폼이나 데이터베이스에서 파일, 문서 또는 리소스를 추적해야 하는 경우 UUID를 각 리소스에 할당하여 위험 없이 쉽게 조회할 수 있습니다. 중복됩니다.
API 및 외부 참조: API에 순차적이거나 쉽게 추측할 수 있는 ID(예: user/1, user/2)를 노출하면 개인정보 보호 취약성이 발생할 수 있습니다. UUID(예: user/66e69275-c6bc-800c-90a6-2f41cb991502)를 사용하면 사용자가 자신에게 속하지 않은 리소스를 추측하고 액세스할 가능성이 줄어듭니다.
Python의 uuid 라이브러리를 사용하면 UUID를 쉽게 생성하고 관리할 수 있습니다. 방법은 다음과 같습니다.
import uuid # Generate a UUID generated_uuid = uuid.uuid4() print(f"Generated UUID: {generated_uuid}")
uuid4() 함수는 웹 개발에 사용되는 가장 일반적인 변형인 난수 또는 의사 난수를 기반으로 임의의 UUID를 생성합니다.
PostgreSQL과 같은 데이터베이스를 사용할 때 UUID를 기본 키로 사용하는 것이 일반적입니다. SQLAlchemy를 사용하여 Python에서 이를 설정하는 방법은 다음과 같습니다.
from sqlalchemy import Column, String from sqlalchemy.dialects.postgresql import UUID import uuid from sqlalchemy.ext.declarative import declarative_base Base = declarative_base() class User(Base): __tablename__ = 'users' id = Column(UUID(as_uuid=True), primary_key=True, default=uuid.uuid4, unique=True, nullable=False) username = Column(String, nullable=False) # This will generate a UUID primary key for each new user.
이 예에서는 id 필드를 UUID로 정의하여 각 사용자가 분산 데이터베이스에서도 다른 레코드와 충돌하지 않는 고유 식별자를 갖도록 보장합니다.
순차 또는 자동 증가 ID를 선호하여 UUID를 무시하면 다음과 같은 여러 위험이 발생할 수 있습니다.
보안 취약성: 순차 ID는 예측 가능하므로 공격자가 쉽게 기록을 열거하고 민감한 데이터를 발견할 수 있습니다. 예를 들어 사용자 ID가 순차적인 경우 공격자는 다른 사용자 ID를 추측하여 승인되지 않은 계정에 액세스하려고 시도할 수 있습니다.
데이터 충돌: 분산 시스템에서 자동 증가 정수에 의존하면 ID 충돌이 발생할 수 있습니다. 특히 여러 서비스나 데이터베이스가 중앙 조정 없이 ID를 생성하는 경우에는 더욱 그렇습니다.
데이터 마이그레이션 및 병합 문제: 데이터베이스를 결합하거나 시스템 간에 데이터를 마이그레이션할 때 고유하지 않은 순차 ID를 사용하면 충돌이 발생할 수 있습니다. UUID는 고유성을 보장하여 이러한 문제를 방지합니다.
UUID를 문자열로 저장: 일반적인 실수는 UUID를 문자열로 저장하는 것입니다. 이는 특히 대규모 데이터베이스에서 공간을 낭비하고 쿼리 속도를 저하시킬 수 있습니다. PostgreSQL과 같은 대부분의 최신 데이터베이스에는 UUID를 효율적으로 저장하는 기본 UUID 유형이 있습니다.
잘못된:
CREATE TABLE users ( id VARCHAR(36) PRIMARY KEY );
오른쪽:
CREATE TABLE users ( id UUID PRIMARY KEY );
올바른 UUID 버전을 사용하지 않음: UUID에는 여러 버전이 있으며(예: uuid1(), uuid3(), uuid4(), uuid5()) 각각 특정 용도에 적합합니다. 사례. 난수를 기반으로 하는 uuid4()는 웹 애플리케이션에서 고유 ID를 생성하는 데 가장 일반적으로 사용됩니다. 사용 중인 버전과 해당 버전이 요구 사항에 맞는지 주의 깊게 살펴보세요.
충돌 가능성 무시: UUID는 고유하게 설계되었지만 충돌 가능성은 매우 낮습니다. 대부분의 애플리케이션에서 위험은 무시할 수 있지만 수십억 개의 UUID를 생성하거나 매우 민감한 환경에서 작동하는 경우 충돌 감지를 구현해야 합니다.
외부 참조에 UUID 사용: URL이나 API에 ID를 노출할 때 순차 ID보다 UUID를 선호하세요. 이렇게 하면 보안이 강화되고 사용자가 리소스 ID를 예측하기가 더 어려워집니다.
기본 형식으로 UUID 저장: 문자열 대신 UUID를 저장하려면 데이터베이스의 기본 UUID 유형을 사용합니다. 이렇게 하면 저장 공간이 줄어들고 쿼리 성능이 향상됩니다.
올바른 UUID 버전 선택: 대부분의 경우 uuid4()(임의 기반 UUID)는 웹 애플리케이션에서 고유 식별자를 생성하는 데 가장 적합한 선택입니다. 그러나 결정적으로 생성된 UUID가 필요한 경우 uuid3() 또는 uuid5()(네임스페이스 기반 UUID)를 고려할 수 있습니다.
UUID 유효성 검사: 사용자 입력에서 UUID를 수락할 때 항상 유효성을 검사하여 처리하기 전에 형식이 올바른지 확인하세요. Python에서는 UUID 개체를 사용하여 문자열의 유효성을 확인할 수 있습니다.
def is_valid_uuid(uuid_to_test, version=4): try: uuid_obj = uuid.UUID(uuid_to_test, version=version) return str(uuid_obj) == uuid_to_test except ValueError: return False # Example usage print(is_valid_uuid("66e69275-c6bc-800c-90a6-2f41cb991502")) # True print(is_valid_uuid("invalid-uuid-string")) # False
UUID는 분산 시스템에서 고유 식별자를 생성하고 웹 애플리케이션의 보안을 보장하는 강력한 도구입니다. 데이터베이스 마이그레이션 중 데이터 충돌, 예측 가능한 ID 공격, ID 충돌과 같은 문제를 방지하는 데 도움이 됩니다. UUID에 대한 모범 사례를 이해하고 따르면 더욱 강력하고 확장 가능하며 안전한 백엔드 시스템을 구축할 수 있습니다.
적절한 UUID 버전을 사용하고, 이를 데이터베이스에 올바르게 저장하고, 잠재적인 위험에 유의하세요. 이러한 팁을 활용하면 프로젝트에서 UUID를 효과적으로 처리할 수 있는 준비를 갖추게 됩니다!
UUID에 대한 질문이나 추가 팁이 있으면 아래에 자유롭게 의견을 남겨주세요! 즐거운 코딩하세요!
부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.
Copyright© 2022 湘ICP备2022001581号-3