news 2026/6/10 23:00:40

SELECT * FROM table LIMIT 1000000, 10的庖丁解牛

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SELECT * FROM table LIMIT 1000000, 10的庖丁解牛

SELECT * FROM table LIMIT 1000000, 10是典型的深度分页查询,表面看是“跳过 100 万行取 10 行”,实则触发全表扫描 + 内存排序,导致磁盘 I/O 爆炸、响应时间飙升


一、执行机制:MySQL 如何处理LIMIT offset, size

▶ 1.执行流程

无索引

有索引

解析 SQL

生成执行计划

是否有索引?

全表扫描 1000010 行

索引扫描 1000010 行

D/E

丢弃前 1000000 行

返回后 10 行

▶ 2.关键问题
  • 必须扫描offset + size
    • 即使只需 10 行,也需读取 1,000,010 行
  • 无法跳过中间行
    • MySQL 不存储“第 N 行的物理位置”(除非聚簇索引)

💡核心认知
LIMIT offset, size的成本 = O(offset + size),而非 O(size)


二、性能陷阱:为什么深度分页如此昂贵?

▶ 1.磁盘 I/O 爆炸
  • 场景
    • 表数据未完全缓存到 Buffer Pool
    • 每读一行需 1 次磁盘随机读(HDD ≈ 10ms/次)
  • 计算
    • 1,000,010 行 × 10ms =2.78 小时(理论值,实际因缓存略低)
▶ 2.内存与 CPU 浪费
  • 排序开销
    • 若无合适索引,需filesort(磁盘临时文件)
  • 网络传输
    • 丢弃的 100 万行仍需从存储引擎传到 Server 层
▶ 3.锁竞争加剧
  • InnoDB 行锁
    • 扫描过程中持有行锁 → 阻塞其他写操作
  • MVCC 版本链
    • 大量历史版本堆积 → Undo Log 膨胀

三、工程优化:四种替代方案

▶ 方案 1:基于游标的分页(推荐)
  • 原理
    • 记录上一页最后一条记录的排序字段值
    • 下一页从该值开始查询
  • 示例
    -- 第一页SELECT*FROMordersWHEREid>0ORDERBYidLIMIT10;-- 第二页(假设上一页最大 id=100)SELECT*FROMordersWHEREid>100ORDERBYidLIMIT10;
  • 优势
    • 执行计划:range→ 直接定位起始点
    • 成本:O(size),与 offset 无关
▶ 方案 2:延迟关联(Deferred Join)
  • 原理
    • 先通过覆盖索引获取主键
    • 再回表查询完整数据
  • 示例
    SELECTt.*FROMorders tINNERJOIN(SELECTidFROMordersORDERBYidLIMIT1000000,10)tmpONt.id=tmp.id;
  • 适用场景
    • 主键为聚簇索引(InnoDB)
    • 覆盖索引可避免回表
▶ 方案 3:记录偏移量(适用于静态数据)
  • 原理
    • 预先计算每页的起始主键
    • 存储到缓存(如 Redis)
  • 示例
    // 缓存第 100000 页起始 ID$startId=Redis::get('page_100000_start_id');$rows=DB::select("SELECT * FROM orders WHERE id >= ? ORDER BY id LIMIT 10",[$startId]);
▶ 方案 4:禁止深度分页
  • 产品设计
    • Google 搜索仅显示前 10 页
    • 电商网站限制“跳转到第 N 页”
  • 技术实现
    if($page>100){thrownewException('超过最大页数');}

四、避坑指南

陷阱破局方案
盲目使用OFFSET深度分页必用游标方案
忽略排序字段选择游标字段必须是索引且唯一(如自增 ID)
宽表全字段查询SELECT必要字段,减少回表

五、终极心法

**“LIMIT 不是分页,
而是性能的悬崖——

  • 当你使用 OFFSET
    你在支付线性成本;
  • 当你切换游标
    你在享受常数时间;
  • 当你限制深度
    你在守护系统。

真正的查询优化,
始于对执行计划的敬畏,
成于对细节的精控。”


结语

从今天起:

  1. 深度分页必用游标方案(WHERE id > last_id
  2. EXPLAIN验证执行计划(避免Using filesort
  3. 产品层限制最大页数(如 ≤ 100 页)

因为最好的分页,
不是跳过百万行,
而是精准定位下一程。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/9 22:29:56

python基于微信小程序的大学篮球协会管理系统

目录摘要概述技术架构核心功能创新点应用价值开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!摘要概述 该系统基于Python后端与微信小程序前端开发,旨在为大学篮球协会提供数字化…

作者头像 李华
网站建设 2026/5/28 19:58:35

Python微信小程序 菜谱分享推荐系统

目录 微信小程序菜谱分享推荐系统摘要关键实现要点 开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式! 微信小程序菜谱分享推荐系统摘要 基于Python的微信小程序菜谱分享推荐系统旨在为用户提…

作者头像 李华
网站建设 2026/6/10 11:26:37

教育科研新革命:书匠策AI如何用“数据魔法”重塑论文写作范式

在教育研究的江湖里,数据是论文的“灵魂燃料”。但面对杂乱无章的问卷数据、晦涩难懂的统计软件,或是图表与学术规范的“相爱相杀”,许多研究者常常陷入“数据焦虑”——明明有满脑子创新想法,却因技术门槛卡在数据分析环节。今天…

作者头像 李华
网站建设 2026/6/9 14:28:09

Linux 命令:join

概述 Linux 中的 join 命令,这个命令的核心作用是按“关键字段”将多个文件的行关联合并(类似数据库的 JOIN 操作),区别于 paste 仅按行号无脑拼接,join 会匹配两个文件中关键字段相同的行,再横向合并&…

作者头像 李华
网站建设 2026/6/9 23:51:16

网络通信模型:OSI七层与TCP/IP四层架构的数据传输机制

一、OSI七层模型物理层(信号传输)→数据链路层(帧封装)→网络层(路由)→传输层(可靠传输)→会话层(连接管理)→表示层(数据格式转换)→…

作者头像 李华
网站建设 2026/5/28 17:09:56

【三端毕设全套源码+文档】基于springboot+微信小程序的热岛志愿者服务平台设计与实现(丰富项目+远程调试+讲解+定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华