如何进行5万并发用户负载测试？_软件工程_Refael Botbol_InfoQ精选文章

AI实践哪家强？来 AICon，解锁技术前沿，探寻产业新机！了解详情 



 写点什么

登录/注册

如何进行5万并发用户负载测试？

本文将介绍运行 5 万并发用户测试所需要的步骤（该测试用户量最多可达 200 万）。

步骤概述

编写脚本；
使用 JMeter 进行本地测试；
BlazeMeter 沙箱测试；
使用一个控制台和一个引擎，设置每个引擎的用户数量；
设置和测试集群（一个控制台和 10 到 14 个引擎）；
使用主从功能达到最大并发量目标。

第 1 步：编写脚本

在开始之前，请先从 JMeter Apache 社区网站（http://jmeter.apache.org/）获取最新的 JMeter 版本。

下载 JMeter 插件管理器（https://jmeter-plugins.org/wiki/PluginsManager/）。下载好 JAR 文件后，将其放入 JMeter 的 lib/ext 目录。然后，启动 JMeter，并转到“选项”菜单，找到插件管理器。

你可以通过多种方式获取脚本：

使用 BlazeMeter Chrome 插件记录测试步骤；
使用 JMeter HTTP（S）测试脚本记录器设置代理，运行测试，并记录所有内容；
从头开始手动操作并构建所有内容（主要针对功能/QA 测试）。

如果你的脚本是通过录制得到（如上面的步骤 1 和 2），请记住：

你需要修改某些参数，例如用户名和密码，或者使用包含这些参数的 CSV 文件，这样每个用户都可以是唯一的。
你可能需要使用正则表达式、JSON 路径提取器、XPath 提取器来提取各种元素（如 Token-String、Form-Build-Id 等），以便完成“AddToCart”、“Login”之类的请求。
保持脚本参数化，并可以使用配置元素（例如 HTTP 请求默认值），以便可以更方便地切换环境。

第 2 步：使用 JMeter 进行本地测试

开始调试脚本，一个线程，进行一次迭代，使用 View Results Tree、Debug Sampler、Dummy Sampler 和打开的 Log Viewer（以防出现 JMeter 错误）。

运行所有的场景（返回 true 和 false），确保脚本可以按预期正常运行。

在使用一个线程成功运行脚本后，将线程数提升到 10 到 20 个，时间为 10 分钟：

如果你希望每个用户都是唯一的——结果是这样的吗？
有发生任何错误吗？
如果你正在进行注册过程测试，请看一下后端——是否根据你的模板创建了帐户？它们是唯一的吗？
从摘要报告中可以看到有关测试的统计信息——它有意义吗？找到平均响应时间、错误、命中率/秒。

在脚本准备好之后：

删除 Debug/Dummy Samplers 和脚本监听器；
如果你使用了监听器（例如“将响应保存到文件”），请确保没有使用任何路径！对于监听器或 CSV 数据集配置，请确保没有使用本地路径。相反，只使用文件名，就好像它与脚本位于同一文件夹中一样。
如果你使用了专有的 JAR 文件，请务必将它上传。
如果你使用了多个线程组（或不是默认线程组），请确保在将其上传到 BlazeMeter 之前设置好这些值。

第 3 步：BlazeMeter 沙箱测试

如果这是你的第一次测试，应该阅读一下这篇文章（http://community.blazemeter.com/knowledgebase/articles/65152-adding-a-new-jmeter-test-plan），了解如何在 BlazeMeter 中创建测试。

沙箱允许你对脚本和后端进行测试，确保 BlazeMeter 一切正常。

首先，按下灰色按钮：选择要控制的 JMeter 引擎，以便完全控制测试参数。

你可能会遇到的常见问题包括：

防火墙——确保你的环境对 BlazeMeter CIDR 列表（正在不时更新）是开放的，并将它们列入白名单；
确保所有测试文件（例如 CSV、JAR、JSON、User.properties 等）都在；
确保没有使用任何本地路径。

如果还有问题，请查看日志中的错误（你应该可以下载整个日志）。

沙箱配置可以是这样的：

引擎：仅限控制台（一个控制台，0 个引擎）
线程：50-300
加速时间：20 分钟
迭代：永远
持续时间：30-50 分钟

你可以在加速期间获得足够的数据，分析一下结果，确保脚本按预期执行。

你应该看一下 Waterfall/WebDriver 选项卡，看看请求是否正常。这个时候你应该不会遇到任何错误（除非你是有意的）。

另外，还要看一下监控选项卡，看看使用了多少内存和 CPU——这有助你完成步骤 4，到时你可以尝试设置每个引擎的用户数。

第 4 步：使用一个控制台和一个引擎设置每个引擎的用户数量

在确信脚本可以在 BlazeMeter 中完美运行之后，我们需要弄清楚一个引擎可以支持多少用户。

如果你能够使用沙箱数据来确定，那就太好了！

我将为你提供一种方法来解决这个问题，无需查看沙箱测试数据。

将测试配置设置为：

线程数：500
加速时间：40 分钟
迭代：永远
持续时间：50 分钟

接下来，使用一个控制台和一个引擎。

运行测试，并通过监控选项卡监控测试引擎。

如果你的引擎没有达到 75％的 CPU 利用率或 85％的内存使用率（可以忽略一次性峰值）：

将线程数改为 700，并再次运行测试；
提高线程数，直到获得 1000 个线程或 60％的 CPU/内存使用率。

如果你的引擎超过了 75％的 CPU 利用率或 85％的内存使用率（可以忽略一次峰值）：

注意第一次达到 75％的时间点，然后查看当时有多少用户。
再次运行测试，这次使用从上一次测试中获得的用户数量。
这一次，使用实际测试的加速时间（5 到 15 分钟是一个不错的值），并将持续时间设置为 50 分钟。
确保在整个测试过程中不要超过 75％的 CPU 或 85％的内存使用率。

为了安全起见，可以为每个引擎减少 10％的线程数。

第 5 步：设置和测试集群

我们现在知道一个引擎可以支持多少线程。在这一步结束时，我们将知道一个集群（测试）可以支持的用户数量。

集群是一种逻辑容器，只有一个控制台和 0 到 14 个引擎。当使用超过 14 个引擎时，它实际上会创建两个集群（控制台数量会增加）并克隆你的测试。

每个控制台最多 14 个引擎是基于 BlazeMeter 的测试得出的结果，可以确保控制台能够处理 14 个引擎的压力。

因此，在这个步骤中，我们将采用步骤 4 的测试，只是将引擎的数量增加到 14。

在测试运行时，请转到监控选项卡，并验证：

不会有引擎超过 75％ CPU 或 85％内存限制；
找到控制台标签。转到日志选项卡->网络信息，查找控制台的私有 IP，这样就可以找到控制台的名称。它不应达到 75％ CPU 或 85％内存限制。

如果控制台达到了这些限制，请减少引擎数量，并再次运行测试，直到控制台处于这些限制范围内。

在这个步骤结束时，你就会知道：

每个集群可以支持的用户数量；
每个集群可以达到的命中次数。

在负载结果图下的聚合表中查找其他统计信息，获取有关集群吞吐量的更多信息。

第 6 步：使用主从功能达到最大并发量目标

我们已经到了最后一个阶段。

我们已经知道脚本可以正常运行，还知道一个引擎可以支持多少用户以及一个集群可以支持多少用户。

我们假设有这些值：

一个引擎可以支持 500 个用户；
集群将有 12 个引擎；
我们的目标是进行 5 万用户的测试。

因此，我们需要创建 50000(500 * 12) = 8.3 个集群。

我们可以使用 8 个包含 12 个引擎（4 万 8）的集群和一个包含 4 个引擎（另外 2 千）的集群。但是，最好可以像这样分布负载：

我们将为每个集群使用 10 个引擎，而不是 12 个，这样每个集群的用户数可以达到 10 * 500 = 5 千。然后再使用 10 个集群，就可以达到 5 万的规模。

这将有助于我们：

不需要维护两种不同的测试类型；
可以通过简单地复制现有的集群每次增长 5 千（5 千比 6 千更常见）；
如果有需要，我们可以随时添加更多的集群。

我们现在准备好用 5 万用户创建最终的主从测试：

将测试名称从“My prod test”更改为“My prod test - slave 1”。
我们回到第 5 步，在高级测试属性里将 Standalone 更改为 Slave。
保存，我们现在有九个从集群测试和一个主集群测试。
回到“My prod test -slave 1”。
按复制。
现在，重复步骤 1 到 5，直到创建完所有的九个从集群测试。
回到“My prod test - slave 9”，并按下复制。
将测试名称改为“My prod test -Master”。
转到高级测试属性，并将 Slave 改为 Master。
检查刚刚创建的所有从集群测试并按保存。

针对 5 万用户的主从测试已准备就绪了。按下主测试的开始按钮，将启动 10 个测试（一个主测试和九个从测试），每个测试有 5 千个用户。

你可以将每个测试（从测试或主测试）更改为来自不同的区域，具有不同的脚本/csv/其他文件，使用不同的网络模拟器或不同的参数。

主测试和从测试的汇总报告将在主测试报告中的一个叫作“Master load results”的新选项卡中找到，打开这个报告就可以看到每个测试的结果。

英文原文：https://dzone.com/articles/how-to-run-a-load-test-of-50k-concurrent-users

评论

发布

暂无评论

企业数字化转型的矛与盾

集团企业分级管理授权能力建设

iam 权限管理系统授权访问

GPUStack v0.4：文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型

Stable Diffusion LLM Whisper Speech-to-Text Text-to-Speech

淘宝天猫API接口探索：商品详情与关键字搜索商品列表的实战应用

API 接口 pinduoduo API

七牛云荣获「2024 鸿蒙生态 SDK 星河奖」

从MySQL JOIN 算法角度看如何优化SQL

京东科技开发者

GPUStack v0.4：文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型

Stable Diffusion LLM Whisper Speech-to-Text Text-to-Speech

OpenAI o1 模型到来后，谈谈提示词工程的未来

程序员 AI Prompt LLMs 提示词工程

让零代码系统界面体验更优秀

Elasticsearch vs 向量数据库:寻找最佳混合检索方案

全文检索 elasticsearch 向量检索 Milvus 混合检索

制造业数字化演进历程中的创新与HAP 赋能

火山引擎数据飞轮最新活动：结合大模型能力，探索金融行业数智化落地新可能

字节跳动数据平台

数字藏品NFT的合约开发

北京木奇移动技术有限公司

软件外包公司音乐NFT 体育NFT

一个明知没啥前途也要开张的市场开张了

阿里大佬翻遍全网Java面试文章，总结出这份1658页文档，GitHub收获25K+点赞

Java 编程程序员面试大厂

探索1688商品详情API：轻松解锁商品信息的全面视角

API 接口 pinduoduo API

更轻更省！DataSimba敏捷版直播火热预约中

信创背景下医院信息化建设的挑战与机遇

RFID技术在ERP系统中的集成应用

积木链小链

想在 Java 八股文面试中脱颖而出？这1000 道互联网大厂工程师面试题必不可少

Java 程序员面试架构师编程开发

心理行业需要用到堡垒机的几个情形讲解

心理网络安全等保堡垒机

收藏品NFT的开发流程

北京木奇移动技术有限公司

NFT数字藏品系统 NFT开发软件外包公司

最新前端架构设计：中央仓库管理-基于工作空间和git-submodule实现共用和管理

京东科技开发者

大数据平台Bug Bash大扫除最佳实践

京东科技开发者

零代码赋能高等教育数字化转型的实践与思考