NULL是未知值标记,不参与比较运算,WHERE中需用IS NULL而非= NULL;索引通常不存NULL,影响查询性能;应优先设NOT NULL并用COALESCE等函数安全处理。
SQL中NULL值不是空字符串、零或布尔假,而是“未知值”的标记,它不参与常规比较运算,也不被普通索引完全覆盖——这是很多查询出错和性能问题的根源。
任何与NULL的直接比较(= NULL、 NULL、> NULL等)结果都是UNKNOWN,而WHERE子句只保留TRUE行,因此这些条件永远不匹配。
WHERE col = NULL → 永远返回空结果,应改为 WHERE col IS NULL
WHERE col != 'A' → 会自动过滤掉col为NULL的行(因为NULL != 'A'是UNKNOWN),如需包含NULL,需显式加 OR col IS NULL
NOT IN (subquery) 遇到子查询含NULL时整体返回空——因逻辑等价于对每个值做 val != x1 AND val != x2 AND ...,一旦x为NULL,该子项为UNKNOWN,整行被排除大多数主流数据库(如MySQL InnoDB、PostgreSQL、SQL Server)默认**不将纯NULL值存入B+树索引的叶子节点**(部分例外见下),这意味着:
WHERE col IS NULL 可能走索引(取决于实现:PostgreSQL支持,MySQL 5.7+对IS NULL也优化;但WHERE col = NULL仍不走)(a, b))中,若a为NULL,整条记录通常不进入索引(除非a定义为NOT NULL),导致 WHERE a IS NULL AND b = 10 很难利用该索引避免逻辑漏洞和隐式类型转换,优先使用标准、显式的NULL处理函数:
COALESCE(col, 'default'):返回第一个非NULL表达式,推荐用于SELECT和JOIN条件(比ISNULL/IFNULL更跨平台)WHERE COALESCE(col, '') = '' 替代模糊的 WHERE col = '' OR col IS NULL(注意语义是否真等价)ON a.key = b.key 会跳过任一端为NULL的行;如需匹配NULL,可写 ON (a.key = b.key) OR (a.key IS NULL AND b.key IS NULL),但会显著影响性能
建议从源头减少NULL带来的不确定性:
created_at DATETIME NOT NULL DEFAULT CURRENT_TIMESTAMP)is_deleted BOOLEAN DEFAULT FALSE),比 deleted_at DATETIME NULL 更易索引和判断