news 2026/4/20 7:21:37

五大方法教你如何分分钟构造百万测试数据!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
五大方法教你如何分分钟构造百万测试数据!

在测试的工作过程中,很多场景是需要构造一些数据在项目里的,方便测试工作的进行,构造的方法有很多,难度和技术深度也不一样。本文提供方法供你选择。

在测试的工作过程中,很多场景是需要构造一些数据在项目里的,方便测试工作的进行。比如下面的场景:

  • 项目需要做性能测试,需要大量的数据

  • 就算是功能测试,比如测试搜索功能,需要有数据做搜索测试

  • 需要检查数据的一致性的检查的时候,也需要项目有大量的数据

  • 如果项目有一些统计表和图,需要测试数据统计正确性的时候,也需要构造海量的测试数据;

那么,测试如何快速的构造测试数据呢?

构造的方法有很多,难度和技术深度也不一样,可以根据数量级的不同可以采取不同的方法。

方法一:如果项目要求的数据不多,几十条或者十几条即可,可以手动页面操作构成

这种方法虽然原始,但是简单没有技术门槛,如果是少量的数据,手动操作也不太费时间。不过如果数据的数量级上来了,那么这种方法就不太靠谱了。

方法二:直接调用接口 批量发送接口请求

这种方法会比纯页面添加要快速一些,使用一个接口测试工具,比如Jmeter,postman的CSV的方法,批量读取数据发送接口请求,实现数据的构造;或者Python的requests库的都可以比较快的实现。

但是这种方法有一定的技术门槛,你必须熟练使用至少一款接口测试的工具。

而且还有一些功能接口要处理接口的依赖,或者有接口本地的一些bug阻塞或者性能瓶颈问题。

既然不管是页面操作还是接口操作,都是本质上把数据插入到数据库中,那我们是否可以直接去数据库插入数据呢?

答案是可以的。

方法三:直接使用sql insert 插入数据

使用使用SQL语句,比如:insert into tuser (username,phone) values ("tricy","13444444444")插入数据。

但是这种方法虽然是对数据库直接操作,奈何效率太低,一条一条的插入,所以这种方法在实际操作中是不可取的。

方法四:一次性从外部导入excel表格数据

第一步:本地电脑准备好一个excel表格,按照数据库的表的字段填入一行数据,然后在excel表格里进行下拉拖拽实现数据的快速复制。如下图:

然后保存好这个excel文件。

第二步:打开连接上MySQL数据库的Navicat,右键我们数据库的表,选择导入向导-->选择excel文件类型进行导入,具体步骤如下图所示:

完成导入操作后,数据库表里就会插入所有excel的数据。

然后这种方式,可以在excel表格手动拖拽复制出来千条数量级的数据,但是如果数据量更大,就也不太方便了。需要有更加高效的方法。

方法五:数据库的存储过程实现快速构建百万级的数据

存储过程其实就是数据库的编程,可以通过编程控制数据插入的次数。如下案例:

  1. drop procedure if exists proc_batch_insert; # 如果存在存储过程就先删除

  2. create procedure proc_batch_insert() # 创建存储过程

  3. begin

  4. declare i int; # 定义一个变量用来计数

  5. declare _name varchar(25); # 定义一个变量用来计数参数化用户名

  6. declare _phone char(11); # 定义一个变量用来计数参数化手机号码

  7. set i=1; # 设置计时器的初始值为1

  8. while i<=1000000 do # while循环控制插入数据的次数

  9. set _name = concat('tom-',i); # 拼接用户名,i为变化的保证用户名的差异性

  10. set _phone = 13000000000+i; # 拼接手机号码,i为变化的保证手机号码的差异性

  11. insert into tuser(username,phone) values(_name,_phone); # 插入数据

  12. set i=i+1; # 每次循环计时器加1

  13. end while;

  14. end

  15. call proc_batch_insert(); # 运行存储过程

方法六:Python代码实现构造百万的数据

如果有代码基础的同学,也可以使用Python代码编程实现这个过程:​​​​​​

  1. import random

  2. import string

  3. import pymysql

  4. # 数据库连接信息

  5. host = '139.224.61.195'

  6. user = 'root'

  7. port = 3307

  8. password = '123456'

  9. database = 'test'

  10. # 建立数据库连接

  11. connection = pymysql.connect(host=host, user=user,port=port, password=password, database=database)

  12. cursor = connection.cursor()

  13. # 构造百万数据

  14. batch_size = 10000 # 每批插入的数据量

  15. total_records = 1000000 # 总共需要生成的数据量

  16. # 获取当前表中最大的id值

  17. cursor.execute("SELECT MAX(id) FROM tuser")

  18. max_id = cursor.fetchone()[0] or 0

  19. for i in range(total_records // batch_size): #是整数除法,它计算出需要进行多少批次的数据生成和插入。

  20. # 生成批量数据

  21. batch_data = []

  22. for i in range(batch_size):

  23. max_id += 1

  24. user_id = max_id # 使用自增长方式生成唯一id

  25. username = ''.join(random.choices(string.ascii_lowercase, k=10))

  26. phone = ''.join(random.choices(string.digits, k=11))

  27. batch_data.append((user_id, username, phone))

  28. # 批量插入数据

  29. sql = "INSERT INTO tuser (id, username, phone) VALUES (%s, %s, %s)"

  30. cursor.executemany(sql, batch_data)

  31. connection.commit()

  32. # 关闭数据库连接

  33. cursor.close()

  34. connection.close()

感谢每一个认真阅读我文章的人,礼尚往来总是要有的,虽然不是什么很值钱的东西,如果你用得到的话可以直接拿走:

这些资料,对于【软件测试】的朋友来说应该是最全面最完整的备战仓库,这个仓库也陪伴上万个测试工程师们走过最艰难的路程,希望也能帮助到你!有需要的小伙伴可以点击下方小卡片领取

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 12:51:34

小白从零开始勇闯人工智能:机器学习初级篇(线性回归与逻辑回归)

引言本章我们来学习机器学习中另两种经典算法&#xff1a;线性回归和逻辑回归。线性回归是一种用于预测连续数值的算法。它通过寻找特征与目标值之间的线性关系&#xff08;即拟合一条直线或超平面&#xff09;来进行预测&#xff0c;其输出可以是任意实数。逻辑回归虽然名为“…

作者头像 李华
网站建设 2026/4/20 3:44:25

[Python] 使用 Tesseract 实现 OCR 文字识别全流程指南

在图像处理、文档数字化、发票识别等场景中&#xff0c;OCR&#xff08;Optical Character Recognition&#xff0c;光学字符识别&#xff09;技术应用广泛。而在 Python 中&#xff0c;借助开源工具 Tesseract&#xff0c;我们可以快速构建强大的文字识别系统。 本文将手把手…

作者头像 李华
网站建设 2026/4/18 13:58:06

Langchain-Chatchat构建电力行业规程查询系统案例

基于 Langchain-Chatchat 构建电力行业智能规程查询系统 在电力系统运行维护中&#xff0c;技术人员每天都要面对大量技术标准、安全规程和操作手册。比如《电力安全工作规程》这类文件动辄上百页&#xff0c;查找“高压设备停电检修的安全措施”可能需要翻阅多个章节&#xff…

作者头像 李华
网站建设 2026/4/18 8:45:09

Cisco 300-515 認證考試介紹(CCNP Service Provider 專項

背景概述思科&#xff08;Cisco&#xff09;旗下的 300-535 Automating and Programming Cisco Service Provider Solutions&#xff08;SPAUTO&#xff09;認證考試&#xff0c;是獲取 CCNP Service Provider 與 Certified DevNet Professional 等高級專業認證的核心組成部分。…

作者头像 李华
网站建设 2026/4/19 4:41:25

70、Windows 7系统维护与问题解决全攻略

Windows 7系统维护与问题解决全攻略 1. 系统清理 1.1 程序清理与系统还原清理 系统中存在许多不再使用的程序和多余的系统还原点、影子副本,占用了大量磁盘空间。程序清理可以移除不用的程序,系统还原和影子副本清理则能删除除最新还原点和影子副本之外的所有内容。 在进…

作者头像 李华
网站建设 2026/4/18 17:51:21

71、Windows 7 系统问题检测、解决与备份指南

Windows 7 系统问题检测、解决与备份指南 1. 系统诊断框架介绍 Windows 7 内置了强大的诊断框架,旨在监控操作系统和计算机硬件组件。该框架包含多个组件,具体如下: | 组件名称 | 功能描述 | | — | — | | 应用兼容性警报 | 警告可能不兼容的程序 | | 磁盘故障监控 |…

作者头像 李华