"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > UUID 이해: 주니어 개발자를 위한 백엔드 엔지니어 가이드

UUID 이해: 주니어 개발자를 위한 백엔드 엔지니어 가이드

2024-11-08에 게시됨
검색:694

Understanding UUIDs: A Backend Engineer’s Guide for Junior Developers

소개

백엔드 엔지니어로서 우리는 각각 고유한 식별이 필요한 수많은 리소스, 사용자 및 엔터티를 확장하고 처리할 수 있는 시스템을 구축하는 임무를 맡는 경우가 많습니다. 대부분의 경우 순차 ID(예: 1, 2, 3)를 사용하는 것은 간단한 해결책처럼 보이지만 애플리케이션이 분산 시스템 전반에 걸쳐 성장하고 확장되면 문제가 될 수 있습니다. 이것이 UUID(Universally Unique Identifiers)가 들어오는 곳입니다.

이 블로그 게시물에서 살펴볼 내용은 다음과 같습니다.

  • UUID란 무엇입니까
  • UUID의 실제 사용 사례
  • Python에서 UUID를 구현하는 방법
  • UUID 무시의 위험
  • UUID 사용 시 흔히 발생하는 실수
  • UUID 사용 모범 사례

UUID란 무엇입니까?

UUID(Universally Unique Identifier)는 컴퓨터 시스템에서 정보를 고유하게 식별하는 데 사용되는 128비트 숫자입니다. 이는 전역적으로 고유하도록 설계되었습니다. 즉, 서로 다른 시스템에서 독립적으로 생성된 UUID가 충돌하지 않는다는 의미입니다.

UUID는 다음과 같습니다:

66e69275-c6bc-800c-90a6-2f41cb991502

32개의 16진수 숫자로 구성되며 8-4-4-4-12 형식으로 하이픈으로 구분된 5개 그룹으로 표시됩니다.

UUID의 실제 사용 사례

  1. 분산 시스템의 데이터베이스 키: 서로 다른 데이터베이스나 마이크로서비스가 서로 통신하지 않고 고유한 ID를 생성해야 하는 시스템에서 UUID는 고유성을 보장합니다. 예를 들어, 분산형 전자상거래 플랫폼에서 각 서비스는 독립적으로 주문 또는 거래 ID를 생성할 수 있으며 UUID는 충돌을 방지합니다.

  2. 세션 ID: UUID는 일반적으로 웹 애플리케이션에서 사용자 세션을 식별하는 데 사용됩니다. 민감하거나 예측 가능한 데이터를 유출하지 않고 세션 정보를 유지해야 할 때 특히 유용합니다.

  3. 파일 또는 리소스 식별자: 다양한 플랫폼이나 데이터베이스에서 파일, 문서 또는 리소스를 추적해야 하는 경우 UUID를 각 리소스에 할당하여 위험 없이 쉽게 조회할 수 있습니다. 중복됩니다.

  4. API 및 외부 참조: API에 순차적이거나 쉽게 추측할 수 있는 ID(예: user/1, user/2)를 노출하면 개인정보 보호 취약성이 발생할 수 있습니다. UUID(예: user/66e69275-c6bc-800c-90a6-2f41cb991502)를 사용하면 사용자가 자신에게 속하지 않은 리소스를 추측하고 액세스할 가능성이 줄어듭니다.

Python에서 UUID 구현

Python의 uuid 라이브러리를 사용하면 UUID를 쉽게 생성하고 관리할 수 있습니다. 방법은 다음과 같습니다.

import uuid

# Generate a UUID
generated_uuid = uuid.uuid4()
print(f"Generated UUID: {generated_uuid}")

uuid4() 함수는 웹 개발에 사용되는 가장 일반적인 변형인 난수 또는 의사 난수를 기반으로 임의의 UUID를 생성합니다.

예: 데이터베이스에서 UUID를 기본 키로 사용

PostgreSQL과 같은 데이터베이스를 사용할 때 UUID를 기본 키로 사용하는 것이 일반적입니다. SQLAlchemy를 사용하여 Python에서 이를 설정하는 방법은 다음과 같습니다.

from sqlalchemy import Column, String
from sqlalchemy.dialects.postgresql import UUID
import uuid
from sqlalchemy.ext.declarative import declarative_base

Base = declarative_base()

class User(Base):
    __tablename__ = 'users'

    id = Column(UUID(as_uuid=True), primary_key=True, default=uuid.uuid4, unique=True, nullable=False)
    username = Column(String, nullable=False)

# This will generate a UUID primary key for each new user.

이 예에서는 id 필드를 UUID로 정의하여 각 사용자가 분산 데이터베이스에서도 다른 레코드와 충돌하지 않는 고유 식별자를 갖도록 보장합니다.

UUID 무시의 위험

순차 또는 자동 증가 ID를 선호하여 UUID를 무시하면 다음과 같은 여러 위험이 ​​발생할 수 있습니다.

  1. 보안 취약성: 순차 ID는 예측 가능하므로 공격자가 쉽게 기록을 열거하고 민감한 데이터를 발견할 수 있습니다. 예를 들어 사용자 ID가 순차적인 경우 공격자는 다른 사용자 ID를 추측하여 승인되지 않은 계정에 액세스하려고 시도할 수 있습니다.

  2. 데이터 충돌: 분산 시스템에서 자동 증가 정수에 의존하면 ID 충돌이 발생할 수 있습니다. 특히 여러 서비스나 데이터베이스가 중앙 조정 없이 ID를 생성하는 경우에는 더욱 그렇습니다.

  3. 데이터 마이그레이션 및 병합 문제: 데이터베이스를 결합하거나 시스템 간에 데이터를 마이그레이션할 때 고유하지 않은 순차 ID를 사용하면 충돌이 발생할 수 있습니다. UUID는 고유성을 보장하여 이러한 문제를 방지합니다.

UUID 사용 시 흔히 저지르는 실수

  1. UUID를 문자열로 저장: 일반적인 실수는 UUID를 문자열로 저장하는 것입니다. 이는 특히 대규모 데이터베이스에서 공간을 낭비하고 쿼리 속도를 저하시킬 수 있습니다. PostgreSQL과 같은 대부분의 최신 데이터베이스에는 UUID를 효율적으로 저장하는 기본 UUID 유형이 있습니다.

    잘못된:

    CREATE TABLE users (
        id VARCHAR(36) PRIMARY KEY
    );
    

    오른쪽:

    CREATE TABLE users (
        id UUID PRIMARY KEY
    );
    
  2. 올바른 UUID 버전을 사용하지 않음: UUID에는 여러 버전이 있으며(예: uuid1(), uuid3(), uuid4(), uuid5()) 각각 특정 용도에 적합합니다. 사례. 난수를 기반으로 하는 uuid4()는 웹 애플리케이션에서 고유 ID를 생성하는 데 가장 일반적으로 사용됩니다. 사용 중인 버전과 해당 버전이 요구 사항에 맞는지 주의 깊게 살펴보세요.

  3. 충돌 가능성 무시: UUID는 고유하게 설계되었지만 충돌 가능성은 매우 낮습니다. 대부분의 애플리케이션에서 위험은 무시할 수 있지만 수십억 개의 UUID를 생성하거나 매우 민감한 환경에서 작동하는 경우 충돌 감지를 구현해야 합니다.

UUID 사용 모범 사례

  1. 외부 참조에 UUID 사용: URL이나 API에 ID를 노출할 때 순차 ID보다 UUID를 선호하세요. 이렇게 하면 보안이 강화되고 사용자가 리소스 ID를 예측하기가 더 어려워집니다.

  2. 기본 형식으로 UUID 저장: 문자열 대신 UUID를 저장하려면 데이터베이스의 기본 UUID 유형을 사용합니다. 이렇게 하면 저장 공간이 줄어들고 쿼리 성능이 향상됩니다.

  3. 올바른 UUID 버전 선택: 대부분의 경우 uuid4()(임의 기반 UUID)는 웹 애플리케이션에서 고유 식별자를 생성하는 데 가장 적합한 선택입니다. 그러나 결정적으로 생성된 UUID가 필요한 경우 uuid3() 또는 uuid5()(네임스페이스 기반 UUID)를 고려할 수 있습니다.

  4. UUID 유효성 검사: 사용자 입력에서 UUID를 수락할 때 항상 유효성을 검사하여 처리하기 전에 형식이 올바른지 확인하세요. Python에서는 UUID 개체를 사용하여 문자열의 유효성을 확인할 수 있습니다.

def is_valid_uuid(uuid_to_test, version=4):
    try:
        uuid_obj = uuid.UUID(uuid_to_test, version=version)
        return str(uuid_obj) == uuid_to_test
    except ValueError:
        return False

# Example usage
print(is_valid_uuid("66e69275-c6bc-800c-90a6-2f41cb991502"))  # True
print(is_valid_uuid("invalid-uuid-string"))  # False

결론

UUID는 분산 시스템에서 고유 식별자를 생성하고 웹 애플리케이션의 보안을 보장하는 강력한 도구입니다. 데이터베이스 마이그레이션 중 데이터 충돌, 예측 가능한 ID 공격, ID 충돌과 같은 문제를 방지하는 데 도움이 됩니다. UUID에 대한 모범 사례를 이해하고 따르면 더욱 강력하고 확장 가능하며 안전한 백엔드 시스템을 구축할 수 있습니다.

적절한 UUID 버전을 사용하고, 이를 데이터베이스에 올바르게 저장하고, 잠재적인 위험에 유의하세요. 이러한 팁을 활용하면 프로젝트에서 UUID를 효과적으로 처리할 수 있는 준비를 갖추게 됩니다!


UUID에 대한 질문이나 추가 팁이 있으면 아래에 자유롭게 의견을 남겨주세요! 즐거운 코딩하세요!

릴리스 선언문 이 기사는 https://dev.to/usooldatascience/understanding-uuids-a-backend-engineers-guide-for-junior-developers-5075?1에 복제되어 있습니다. 침해가 있는 경우에는 [email protected]으로 문의하시기 바랍니다. 그것을 삭제하려면
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3