PostgreSQL 删除数据

Begindev 编辑部 March 31, 2026

从数据表中删除数据是数据管理中至关重要的一环。PostgreSQL 中的 DELETE 语句允许你根据特定条件从表中移除指定的行。

本章将深入探索 DELETE 语句的语法、选项以及最佳实践，教你如何安全、有效地使用它，以维护数据库的完整性和准确性。

1. 基础 DELETE 语句 (全表删除危险操作)

在 PostgreSQL 中，删除数据的最基础语法如下：

DELETE FROM table_name;

极度危险： 当执行这条没有任何条件的语句时，它会删除指定表（table_name）中的所有行！由于这会造成极其严重的后果，在使用这种形式的语句时必须万分谨慎。在敲下回车键之前，一定要反复确认这是否真的是你想要的结果。

示例：
假设你有一个名为 customers (客户) 的表，包含以下数据：

customer_id (客户ID)	first_name (名字)	last_name (姓氏)	email (邮箱)
1	John	Doe	john.doe@example.com
2	Jane	Smith	jane.smith@example.com
3	David	Lee	david.lee@example.com

如果你执行以下语句：

DELETE FROM customers;

其结果将是 customers 表被彻底清空。所有的行都会消失，只留下一个空荡荡的表结构。

2. 使用 WHERE 子句进行精准删除

为了有选择性地删除特定的行，你必须使用 WHERE 子句。WHERE 子句指定了数据行被删除前必须满足的条件。这是使用 DELETE 语句最常见，也是最安全的方式。

带有 WHERE 子句的语法如下：

DELETE FROM table_name
WHERE condition;

只有满足 condition (条件) 的行才会被删除。

示例：
如果你想从 customers 表中仅仅删除 customer_id = 3 的那位客户，你可以使用以下语句：

DELETE FROM customers
WHERE customer_id = 3;

执行后，customers 表将变成这样：

customer_id	first_name	last_name	email
1	John	Doe	john.doe@example.com
2	Jane	Smith	jane.smith@example.com

customer_id = 3 的那行数据已经被成功移除了。

3. WHERE 子句中的多条件与比较

你可以使用逻辑运算符（如 AND、OR 和 NOT）在 WHERE 子句中组合多个条件。

示例：使用逻辑运算符
要删除姓氏为 "Doe" 并且 (AND) 名字为 "John" 的客户：

DELETE FROM customers
WHERE last_name = 'Doe' AND first_name = 'John';

要删除姓氏为 "Doe" 或者 (OR) 名字为 "Jane" 的客户：

DELETE FROM customers
WHERE last_name = 'Doe' OR first_name = 'Jane';

示例：使用比较运算符WHERE 子句还可以使用各种比较运算符，例如 = (等于)、!= (不等于)、> (大于)、< (小于)、>= (大于等于) 和 <= (小于等于)。

假设你有一个名为 orders (订单) 的表，里面有一列 order_date (订单日期)。要想删除在特定日期（比如 2023年1月1日）之前的所有订单，你可以使用：

DELETE FROM orders
WHERE order_date < '2023-01-01';

4. 真实业务实战案例

让我们来看几个更贴近实际工作的 DELETE 应用场景。

4.1 示例 1：清理未激活用户

假设你有一个 users (用户) 表，包含一个 is_active (布尔类型，表示是否激活) 列。你可以这样清理所有未激活的用户：

DELETE FROM users
WHERE is_active = FALSE;

4.2 示例 2：下架陈旧产品

假设你的 products (产品) 表有一个 last_updated (最后更新时间) 列。你可以删除那些已经很久（比如超过 5 年）没有更新过的产品：

DELETE FROM products
WHERE last_updated < NOW() - INTERVAL '5 year';

4.3 示例 3：删除重复的冗余数据 (进阶操作)

这是一个非常实用的高级场景。假设你想清理表中的重复数据。这通常需要先找出重复的行，然后保留其中一条，删除其余的。这里会用到子查询。

假设场景与原理：
一家名为 "ShopSmart" 的电商公司由于系统同步错误，产品库里偶尔会出现重复的商品。这些重复项导致库存混乱。他们需要自动清理它们。

假设表名为 product_inventory (产品库存)，包含 product_id (主键)、product_name (产品名) 和 quantity (数量)。为了简化，我们认为只要 product_name 一样就是重复的。

WITH RankedProducts AS (
    SELECT
        product_id,
        product_name,
        quantity,
        ROW_NUMBER() OVER (PARTITION BY product_name ORDER BY product_id) as rn
    FROM
        product_inventory
)
DELETE FROM product_inventory
WHERE product_id IN (SELECT product_id FROM RankedProducts WHERE rn > 1);

代码拆解详解：

通用表表达式 (CTE): WITH RankedProducts AS (...) 定义了一个只在当前查询中有效的临时结果集。
窗口函数: ROW_NUMBER() OVER (PARTITION BY product_name ORDER BY product_id)。它会把相同 product_name 的行分到一个“组 (Partition)”里，然后按照 product_id 从小到大给组里的行排号 (rn)。ID 最小的拿到 1 号。
子查询选出重复项: SELECT product_id FROM RankedProducts WHERE rn > 1。这句查出了所有排名大于 1 的行，也就是我们要干掉的“重复项”（保留排第 1 的那个）。
执行删除: 最后的外层 DELETE 语句，对照着找出的 ID 列表，把它们清理干净。

(注：虽然这是稍显复杂的进阶用法，但它展示了 DELETE 语句在真实复杂场景中的威力。)

5. 安全删除的黄金法则与最佳实践

5.1 数据备份 (Backups)

在执行任何 DELETE 语句（尤其是涉及大量数据的操作）之前，强烈建议先备份你的数据。这是你的后悔药，万一删错了或者执行过程中发生意外，你可以随时恢复。

5.2 开启事务 (Transactions)

强烈建议将你的 DELETE 语句包裹在数据库事务中。事务允许你将一系列操作打包，要么全部成功提交 (Commit)，要么在发生错误时全部撤销 (Rollback)。我们在后面的模块会详细讲事务。

BEGIN; -- 开启事务

DELETE FROM table_name
WHERE condition;

COMMIT; -- 确认无误，提交更改

如果你在执行后（且在 COMMIT 之前）发现删错了，你可以立刻执行以下命令来“时光倒流”：

ROLLBACK; -- 撤销刚才的删除操作

5.3 性能优化 (Performance)

删除海量数据非常耗费系统资源。请考虑以下优化技巧：

利用索引 (Index Usage): 确保 WHERE 子句中用作过滤条件的列上建有索引。这能极大加快数据库寻找要删除的行的速度。
分批删除 (Batch Deletion): 如果你需要删除几百万行数据，千万不要一次性删完。试着分批次删除（比如每次删一万行）。这能减轻数据库服务器的压力，防止系统卡死或锁表。
清理维护 (Maintenance): 在进行大规模删除后，数据库底层其实并没有立刻释放磁盘空间。养成好习惯，运行 VACUUM 和 ANALYZE 命令来回收空间并更新查询统计信息。

5.4 权限控制 (Permissions)

确保执行 DELETE 语句的数据库用户拥有该表的删除权限。权限不足将直接导致命令报错。