使用 Python 高效处理重复对象
在 Python 中,可能需要从列表中删除重复对象,同时保持原始顺序。当您有自定义对象列表并希望根据某些条件过滤重复项或检查数据库中的重复项时,就会出现此问题。
根据您的具体要求,您需要定义对象内的唯一性才能有效使用set(list_of_objects) 方法。这涉及通过实现 eq 和 hash 方法使对象可哈希。
eq 方法定义对象相等性。例如,如果您的 Book 对象具有author_name 和 title 属性,其中作者和标题的组合是唯一的,则 eq 方法可能如下所示:
def __eq__(self, other):
return self.author_name == other.author_name and self.title == other.title
同样,hash方法生成对象的哈希值。一种常见的方法是对关键属性的元组进行哈希处理:
def __hash__(self):
return hash(('title', self.title, 'author_name', self.author_name))
有了这些方法,您现在可以从 Book 对象列表中删除重复项:
books = [Book('title1', 'author1'), Book('title2', 'author2'), Book('title1', 'author1')]
unique_books = list(set(books))
此外,要检查数据库中的重复项,可以使用以下方法:
import sqlalchemy
session = sqlalchemy.orm.sessionmaker()()
records = session.query(YourModel).all()
existing_titles = set([record.title for record in records])
unique_objects = [obj for obj in objects if obj.title not in existing_titles]
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3