"일꾼이 일을 잘하려면 먼저 도구를 갈고 닦아야 한다." - 공자, 『논어』.
첫 장 > 프로그램 작성 > 순서를 유지하면서 Python 목록에서 중복 개체를 효율적으로 제거하려면 어떻게 해야 합니까?

순서를 유지하면서 Python 목록에서 중복 개체를 효율적으로 제거하려면 어떻게 해야 합니까?

2024-11-03에 게시됨
검색:408

How Do I Efficiently Remove Duplicate Objects from a Python List While Preserving Order?

Python을 사용하여 중복 개체를 효율적으로 처리

Python에서는 원래 순서를 유지하면서 목록에서 중복 개체를 제거해야 할 수 있습니다. 이 문제는 사용자 정의 개체 목록이 있고 특정 기준에 따라 중복 항목을 필터링하거나 데이터베이스에서 중복 항목을 확인하려고 할 때 발생합니다.

특정 요구 사항과 관련하여 효과적으로 사용하려면 개체 내에서 고유성을 정의해야 합니다. set(list_of_objects) 메소드. 여기에는 eqhash 메소드를 구현하여 객체를 해시 가능하게 만드는 작업이 포함됩니다.

eq 메소드는 객체 동등성을 정의합니다. 예를 들어, 저자와 제목의 조합이 고유한,author_name 및 title 속성이 있는 Book 객체가 있는 경우 eq 메소드는 다음과 같습니다:

def __eq__(self, other):
    return self.author_name == other.author_name and self.title == other.title

마찬가지로 hash 메소드는 객체에 대한 해시 값을 생성합니다. 일반적인 접근 방식은 주요 속성의 튜플을 해시하는 것입니다:

def __hash__(self):
    return hash(('title', self.title, 'author_name', self.author_name))

이러한 메소드를 사용하면 이제 Book 개체 목록에서 중복 항목을 제거할 수 있습니다.

books = [Book('title1', 'author1'), Book('title2', 'author2'), Book('title1', 'author1')]
unique_books = list(set(books))

또한 데이터베이스에서 중복 항목을 확인하려면 다음 접근 방식을 사용할 수 있습니다.

import sqlalchemy

session = sqlalchemy.orm.sessionmaker()()
records = session.query(YourModel).all()
existing_titles = set([record.title for record in records])
unique_objects = [obj for obj in objects if obj.title not in existing_titles]
최신 튜토리얼 더>

부인 성명: 제공된 모든 리소스는 부분적으로 인터넷에서 가져온 것입니다. 귀하의 저작권이나 기타 권리 및 이익이 침해된 경우 자세한 이유를 설명하고 저작권 또는 권리 및 이익에 대한 증거를 제공한 후 이메일([email protected])로 보내주십시오. 최대한 빨리 처리해 드리겠습니다.

Copyright© 2022 湘ICP备2022001581号-3