在我的一次采访中,有人问我,假设您正在对 50 个用户执行负载测试。事务响应时间在 3 秒内捕获。一段时间后,您再次执行相同的用户秒数,时间响应时间捕获 8 秒。增加交易响应时间的可能原因是什么?
原因可能是任意的:磁异常、太阳黑子、正在测试的系统在后台工作、第二次测试击中了负载均衡器后面的另一个节点、您的同事正在下载他最喜欢的色情内容,消耗了 90% 的互联网通道带宽,等等。
这就是为什么查看单个指标永远无法告诉您完整的情况,您需要将负载生成器中的各种指标关联起来,例如:
对于被测系统,您至少应该监控资源消耗(CPU、RAM、网络和磁盘 IO 等)以及应用程序特定指标、数据库慢速查询等。为了更好地分析负载测试的影响,您需要在被测系统上安装一个 profiler 工具,甚至更好的是 APM 工具,这样您就能够找到瓶颈的根源