在 SQL 中,可以使用“NOT IN”选择一个表中存在但另一个表中不存在的行操作员。然而,这种方法有时会导致大型数据集的性能问题。
考虑这样一个场景,您有两个表 A 和 B,它们具有相同的主键。要选择 A 中 B 中不存在的所有行,可以使用以下查询:
SELECT *
FROM A
WHERE NOT EXISTS (
SELECT *
FROM B
WHERE A.pk = B.pk
);
虽然此查询有效,但效率可能较低,尤其是对于大型表。数据库必须对 A 中的每一行执行嵌套查询,检查其在 B 中的存在。
更好的方法是使用左连接并根据空值过滤结果。此方法涉及在公共列上连接 A 和 B,然后从 A 中选择 B 中相应列为空的行:
SELECT A.*
FROM A
LEFT JOIN B
ON A.x = B.y
WHERE B.y IS NULL;
此查询执行单个联接操作,并根据 B 中是否存在值来过滤结果。对于大型数据集,它通常比“NOT IN”方法更快。
或者,您可以在 WHERE 子句中使用子查询:
SELECT A.*
FROM A
WHERE x NOT IN (
SELECT y
FROM B
);
这种方法还可以为大型数据集提供良好的性能。
最终,优化查询的最佳方法取决于具体的数据和数据库配置。建议测试不同的方法并选择能为您的查询提供最佳性能的方法。
免责声明: 提供的所有资源部分来自互联网,如果有侵犯您的版权或其他权益,请说明详细缘由并提供版权或权益证明然后发到邮箱:[email protected] 我们会第一时间内为您处理。
Copyright© 2022 湘ICP备2022001581号-3