2.6 聚合函数和迭代函数
第2章 DAX简介
2.1 理解DAX计算
2.2了解计算列和度量值
2.3 变量入门
2.4 表达式中的错误处理
2.5 格式化DAX代码
2.6 聚合函数和迭代函数
2.7 使用常见的DAX函数
聚合函数和迭代函数
几乎每个数据模型都需要对聚合数据进行操作。DAX提供了一组函数,这些函数可以聚合表中列的值并返回单个值。我们称这组函数为聚合函数。例如,以下度量值将计算Sales表的SalesAmount列中所有数字的总和:
Sales := SUM ( Sales[SalesAmount] )
SUM如果用于计算列中,则 汇总表的所有行。当在度量值中使用时,它仅汇总由切片器,行,列和报表中的过滤条件过滤的行。
聚合函数有很多(SUM,AVERAGE,MIN,MAX和STDEV),它们的作用因聚合值的方式不同而不同:SUM累加值,而MIN返回最小值。几乎所有这些函数仅对数值或日期起作用。只有MIN和MAX也可以对文本值进行运算。此外,DAX在执行聚合时从不考虑空单元格,这与Excel中对待空单元格不同(本章稍后将对此进行详细介绍)。
注意
如果与两个参数一起使用,则 MIN 和 MAX会提供另一种行为,它们返回两个参数的最小值或最大值。因此, MIN (1、2)返回1, MAX (1、2)返回2。当需要计算复杂表达式的最小值或最大值时,此函数很有用,因为这样就避免了在IF语句中多次重复同一表达式。
到目前为止,我们介绍的所有聚合函数都适用于列,然而这些函数仅聚合来自单个列的值。有些聚合函数可以聚合一个表达式而不是单列值。基于它们的工作方式,这些函数被称为迭代函数。这组函数非常有用,特别是用关联表的列进行计算时,或者在需要减少计算列数时,尤其如此。
迭代函数至少接受两个参数:第一个是它们扫描的表;第二个通常是对表每行评估的表达式。在完成扫描表并逐行评估后,迭代函数将根据其语义聚合出结果。
例如,如果我们在名为DaysToDeliver的计算列中计算交付订单所需的天数,并在此基础上构建报告,则会获得如图2-6 所示的报告。请注意,总计显示的是所有天数的总和,这个数字没啥用:
Sales[DaysToDeliver] = INT ( Sales[Delivery Date] - Sales[Order Date] )
这里,实际有用的总计是需要一个的度量值(称为AvgDelivery),该度量值显示每个订单的交货时间,以及所有订单交货天数总计级别上的平均值:
AvgDelivery := AVERAGE ( Sales[DaysToDeliver] )
新度量值的结果在图2-7 所示的报告中可见:
图2-7 按平均值聚合的度量值显示了总计级别的平均交货天数
该度量值对计算列求平均值。还可以利用迭代函数删除计算列从而节省模型中的空间。尽管AVERAGE确实不能对表达式求平均值,但其对应的AVERAGEX可以迭代Sales表并逐行计算交货天数,最后平均结果。此代码完成的结果与先前的定义相同:
AvgDelivery :=
AVERAGEX (
Sales,
INT ( Sales[Delivery Date] - Sales[Order Date] )
)
最后一个表达式的最大优点是它不依赖于计算列的存在。因此,我们可以构建整个报表而无须创建昂贵的计算列。
大多数迭代函数的名称与非迭代函数的名称相同。例如,SUM具有对应的SUMX,而MIN具有对应的MINX。但是,请记住,某些迭代函数并不对应于聚合函数,在本书后面章节,您将了解到FILTER,ADDCOLUMNS,GENERATE等函数,即使它们没有聚合结果,也是迭代函数。
初学DAX时,您可能会认为迭代函数就很慢。逐行执行计算的概念貌似是占用大量CPU的操作。实际上,迭代函数速度很快,并且使用迭代函数而不是标准聚合函数不会导致性能下降。聚合函数只是迭代函数的一种语法版本。
实际上,基本聚合函数是相应的X后缀函数的简化版本。例如以下表达式:
SUM ( Sales[Quantity] )
内部翻译为相同代码的相应版本:
SUMX ( Sales, Sales[Quantity] )
使用SUM的唯一优点是语法较短。汇总单列的SUM和SUMX之间的性能没有差异。它们在所有方面都具有相同的作用。
我们将在第4章介绍与此相关的更多详细内容,介绍评估上下文的概念,迭代函数的工作原理。