精品丨PowerBI负载测试和容量规划

2024-03-29 本文已影响0人 Fabric丨白茶

当选择Power BI作为业务报表平台时，如何判断许可证的选择是否符合业务需求，价格占了主导因素。
Power BI的定价是基于SKU和服务器内核决定的，但是很多IT的负责人都不确定自己公司业务具体需要多少。
不幸的是，Power BI的容量和预期使用量的比率很难进行量化的评估。

注：本文非原创，是搬运过来的，原文链接^[1]在文章末尾。

例如：

一家公司可能有一个非常大的数据模型，需要占用大量的内存和CPU来进行长时间的刷新，高峰期有20个用户，每小时刷新一次，查询都非常简单，并且允许查询折叠。

另一家企业可能有6个较小的数据模型，高峰期有950个用户，每天刷新，数据模型的查询都非常非常复杂。这些相关元素都会影响后台资源的使用情况，使得预测总体资源并作为许可证选择的依据这件事变得几乎是不可能的。

值得庆幸的是，内存负载测试可以给我们提供一个良好的参照依据。
本文将介绍如何对你的内存进行负载测试、负载测试的规划要素以及如何理解负载测试的结果。

先决条件

• 具备权限，可以访问Premium容量利用率和指标应用程序/报表 (利用率和指标报表^[2])
• 具备权限，可以访问你想测试的报表
• PC需要足够的CPU和内存来运行并发测试时的多浏览器窗口
• 足够的权限来运行PowerShell(即以管理员身份运行)
• 负载测试工具^[3](说明在后面)

搭建&测试

导航到负载测试工具的GitHub^[4]，下载包含PowerShell脚本的zip文件。负载测试工具有两个选项，默认测试 "最坏的情况"，即所有用户同时登录，并不断点击过滤器，从而迫使Power BI忽略其缓存。
现实加载测试工具^[5]的操作类似于默认加载测试工具，但它测试的不是初始加载时间，而是最终用户可能会使用的可编程功能，如更改切片器、筛选器和浏览书签，并在操作之间留出一些 "思考时间"。
在本演示中，我们将使用标准负载测试工具，以保持简单。
有关使用实际负载测试工具的进一步说明，请参阅 ReadMe 文件。

注意：
此PowerShell脚本包含一个未签名的PowerShell脚本。必须首先使用Set-ExecutionPolicy Unrestricted命令才能允许运行未签名脚本。
它还要求从此处安装^[6] "MicrosoftPowerBIMgmt" Power BI PowerShell模块。

将文件解压缩到桌面（或虚拟机）上的文件夹中，然后导航到Initiate_Load.ps1文件。
右键单击该文件，在PowerShell中运行。

PowerShell脚本将引导你完成一些提示设置：

你想配置多少个报表？这个会影响并发ping报表的数量。
- 请记住，你可以在相同的PowerShell窗口中ping不同工作区的报表。输入一个数字，然后回车。
身份验证
- 会弹出一个登录窗口，需要登录并且访问你想要测试的工作区
从列表选择工作区索引
- 在需要进行负载测试的报表所在的工作区旁边输入数字，然后回车。
从列表选择报表索引
- 在需要进行负载测试的报表旁边输入数字，然后回车。
过滤需要的过滤表、过滤列、过滤列中的最小值和最大值
- 这是脚本绕过Power BI服务器中缓存特性的方式。通过提供表、列、最小值和最大值，脚本能够将不同的过滤上下文传递加载报表。
- 建议使用与整个数据模型交互的日期表或事实表，并使用数字字段(最小值和最大值对文本字段没有意义)。
- 确保变量和逗号之间没有空格。
例如：
我有一张名为“Invoice Date”的表，存在名为“MonthsAgo”的列，我想对其进行过滤，则输入“InvoiceDate.MonthsAgo,0,4”。
输入要为此报表启动的实例数
- 这是当ping报表时，打开浏览器窗口的数量。输入一个数字，然后回车。
- 建议从10开始，然后逐步升级测试，避免因为窗口数量太多造成电脑崩溃。
要启动配置好的报表么？[y/n]
- 如果上面的配置没有任何问题，那么输入“y”就可以了。
- 如果需要终止测试的运行，那么输入“n”。

如果要测试数据集刷新是否会影响用户体验（反之亦然），请进入Power BI在线服务，并手动刷新正在进行负载测试报表的数据集。
虽然负载测试工具适合测试交互操作，但是一些后台操作需要在工具外完成。
有一些Rest Api^[7]可以触发Power BI数据集刷新，本文不涉及这些。
如果浏览器窗口的数量超过了电脑的内存容量，则窗口会超时，需要单独刷新浏览器页面以使它们再次运行。

建议一次只允许10个页面处于活动状态。
注意在每个窗口的左上角有一个小提示。
这个是提醒该窗口ping Power BI服务的次数。
要停止每个窗口的ping，需要单独关闭每个窗口。
所有的窗口将在初始脚本运行一小时后超时，因为API生成的令牌将在一小时后过期。

负载测试到现在已经完成!需要等待大约45分钟。然后手动刷新容量和指标报表的数据集。

容量规划注意事项

Power BI容量规划和管理是一项艰巨的任务。

微软建议根据Power BI项目(数据集、数据流等)的大小来设置容量大小，因为这个直接影响SKU内的操作速度(提前规划容量^[8])。

这是一个很好的建议，但不幸的是，这种方法不适合数据总量小且交互频率非常高的项目。

例如：
假设有一个经过认证的数据集和八个使用该数据集的报表。
每个报表都有20-30人观看，因为现在是月底，所有的分析师、客户经理和高管都在用这些报表的截图准备他们的汇报。
这时候此数据集(以及容量)的负载就像有160-240个用户与数据集交互一样。
现在把它放大——如果有100个人在看每份报表。
针对此数据集/项目的使用会成倍增长，因此经过优化的认证数据集对CPU的压力要比只有一个报表的数据集大得多。
这就是为什么在评估最佳SKU/CPU的时候，必须同时考虑后台操作和交互操作的原因。

Power BI中的容量由以下几个变量决定: