EXISTS子查询返回TRUE或FALSE,基本写法为SELECT...FROM t1 WHERE EXISTS(SELECT 1 FROM t2 WHERE condition);必须关联外层表,否则导致全表扫描;相比IN和NOT IN,EXISTS对NULL安全且性能更优。
EXISTS 本身不返回具体值,只返回 TRUE 或 FALSE。它的基本形式是:
SELECT ... FROM table1 WHERE EXISTS (SELECT 1 FROM table2 WHERE condition);注意子查询里通常用
SELECT 1(或 SELECT *),因为 EXISTS 只关心「是否有行」,不关心返回什么列。MySQL 会一找到匹配行就短路退出,不遍历全部结果。
两者都用于存在性判断,但行为不同:
IN 要求子查询返回非空结果集,且不能包含 NULL —— 如果子查询结果含 NULL,整个 IN 表达式可能变成 UNKNOWN,导致意外过滤EXISTS 对 NULL 不敏感,只要子查询能关联出至少一行
(哪怕某列为 NULL),就返回 TRUE
EXISTS 通常比 IN 更快,尤其当子查询表很大、外层表较小时,因为它是“对外层每行执行一次半连接”,可利用索引提前终止最典型的错误是子查询没和外部表建立关联,变成「非相关子查询」:
SELECT * FROM orders WHERE EXISTS (SELECT 1 FROM customers WHERE status = 'active');这会导致:只要
customers 表中存在任意一条 status = 'active' 记录,orders 全表都会被选中。正确写法必须加关联:SELECT * FROM orders o WHERE EXISTS (SELECT 1 FROM customers c WHERE c.id = o.customer_id AND c.status = 'active');否则语义完全偏离预期,且执行计划里会出现
DEPENDENT SUBQUERY 缺失、实际走全表扫描。
NOT EXISTS 是 EXISTS 的自然反向,它在子查询无匹配时返回 TRUE。相比 NOT IN,它对 NULL 完全安全:
WHERE id NOT IN (1, 2, NULL) 永远不成立(因为 id = NULL 是未知的)WHERE NOT EXISTS (SELECT 1 FROM t2 WHERE t2.id = t1.id) 只要 t2 中没匹配行,就为真,不管 t2.id 是否有 NULL
NULL 的字段(比如外键未约束 NOT NULL)时,优先用 NOT EXISTS。实际写的时候,别光看语法像不像,重点检查子查询里有没有用到外层表的列 —— 这个点漏掉,整个逻辑就垮了。