具有R Markdown的企业仪表板(一)
长期以来,我们一直使用电子表格,以至于大多数办公室工作人员认为电子表格显然是通过Microsoft Excel等程序生成的让您更容易理解数据并传达见解。从最新的实习生到CEO,企业中的每个人都有一些电子表格的经验。但使用Excel作为事实上的分析标准是有问题的。完全依赖Excel生成的环境几乎不可能组织和维护高效的操作工作流程。除了促进低生产率之外,在富有洞察力的分析和过程控制转化为竞争优势的时代,组织还要冒险获利和声誉。大多数组织希望更好地控制访问,分发和处理数据。您可以使用R编程语言以及R Markdown报告和RStudio Connect来构建强大,安全且可管理的企业仪表板。
image.png此Excel仪表板通过允许其用户过滤和可视化关于客户的关键指标,尝试用作实际应用程序。建造需要几十个小时。目的是将维护交给其他人,但仪表板非常复杂,以至于作者被迫维护它。每周,作者从ETL工具复制数据并将其粘贴到工作簿中,检查几个单元格,然后通过电子邮件将整个工作簿发送到分发列表。发布列表中的每个人每周都会在收件箱中收到一份新副本。没有围绕数据管理或数据访问的安全控制。报告的任何人都可以修改其内容。更新过程经常打破脆弱的细胞依赖性; 或者更糟糕的是,几周之间的差异没有被注意到。
为什么编码很重要
Excel工作簿很难维护,协作和调试,因为它们不可重现。每个单元格的内容和每个图表的设计都是在没有记录作者行为的情况下设定的。没有简单的方法来重新创建Excel工作簿,因为没有描述它是如何制作的配方(即一组指令)。由于Excel工作簿缺少配方,因此它们往往难以维护并且容易出错。它需要谨慎,警惕和主题知识来维护复杂的Excel工作簿。即便如此,人为错误仍然存在,变化需要付出很多努力。
更好的方法是编写代码。开始编程有很多原因。当您使用代码创建配方时,任何人都可以重现您的工作(包括您未来的自我)。隐含的编码行为邀请其他人与您合作。您可以系统地验证和调试代码。随着时间的推移,所有这些都会带来更好的代码。R中的编码具有特别的优势,因为其庞大的包裹生态系统,充满活力的社区以及强大的工具链。
使用R Markdown
有许多工具可以用R代码替换复杂的Excel仪表板。其中一个工具是R Markdown,一个开源R软件包,可将您的分析转换为高质量的文档,报告,演示文稿和仪表板。R Markdown文档完全可重现,并支持许多输出格式,包括HTML,PDF和Microsoft Word文档。
image.png以下是转换为R Markdown报告的相同Excel仪表板。因为这个报告是用代码编写的,所以它更简单,更容易维护。与上面的Excel仪表板一样,此R Markdown报告旨在获取用户输入,以便它可以呈现自定义报告版本。
许多人已经意识到R Markdown报告将叙述,代码和输出结合在一个文档中。不太常见的是,您可以通过在文档标题中声明参数来概括任何R Markdown报告。带参数的R Markdown文档称为参数化报告。在Excel的仪表板用户可以选择segment,group和period。在参数化的R Markdown文档中,您可以使用以下YAML标头指定这些输入:
title: Customer Tracker Report
output: html_notebook
params:
seg:
label: "Segment:"
value: Total
input: select
choices: [Total, Heavy, Mainstream, Focus1, Focus2,
Specialty, Diverse1, Diverse2, Other, New]
grp:
label: "Group:"
value: Total
input: select
choices: [Total, Core, Extra]
per:
label: "Period:"
value: Week
input: radio
choices: [Week, YTD]
然后,您可以从R代码块中调用您在YAML标头中声明的参数。
```{r}
params$segment
params$grp
params$per
您可以通过在RStudio中选择带有参数的编织来渲染具有不同输入的文档。此选项将打开一个用户界面,允许您选择所需的参数。
如果要自动创建自定义报告版本的过程,可以使用该rmarkdown::render()功能以编程方式呈现这些文档。
rmarkdown::render(
input = "tracker-report.Rmd",
params = list(seg = "Focus1", grp = "Core", per = "Weekly")
)
发布到RStudio Connect
管理Excel文件的访问权限和权限是很痛苦的。Excel中的数据通过组织传播,没有像病毒那样的控件通过身体传播而没有疾病预防。有更好的方法来保护信息的操作,访问和分发。
image.pngRStudio Connect是RStudio的服务器产品,专为安全共享R内容而设计。它是您在防火墙后运行的本地软件。您可以控制数据以及谁有权访问。使用RStudio Connect,您可以查看所有内容,确定谁应该能够查看和协作,调整性能,安排更新和查看日志。您可以安排R Markdown报告自动运行,甚至可以通过电子邮件分发最新版本。
将参数化的R Markdown报告发布到RStudio Connect时,会出现一个用于选择输入的界面。观看者可以创建新的报告版本,然后通过电子邮件发送副本。协作者可以保存和安排新的报告版本,然后通过电子邮件向他人发送副本。您甚至可以将输出文件附加到这些版本。在RStudio Connect中使用参数化的R Markdown文档是一种强大的信息交流方式。
您可以通过单击看起来像蓝色荷鲁斯之眼的“ 发布”按钮从RStudio IDE发布内容。按此按钮将开始发布过程。首先,它会创建一组用于重新创建内容的说明。其次,它将您的内容包部署到服务器。第三,它在RStudio Connect上重新创建您的内容。按钮发布与RStudio一起使用的历史悠久。2012年,RStudio将R Markdown文档的按钮发布到RPubs。2014年,RStudio将Shiny应用程序的按钮发布到shinyapps.io。2016年,RStudio启用了按钮发布到RStudio Connect。
shinny
R Markdown文档使用批处理进行渲染。这使它们成为自动化,长时间运行的工作流程和自定义报告版本的理想选择。但是,如果您希望文档立即响应用户输入,则可以添加Shiny运行时。这些交互式文档的行为类似于Shiny应用程序,因为它们必须托管。您可以使用RStudio Connect 托管交互式文档和Shiny应用程序。决定何时在R Markdown,交互式文档和Shiny应用程序之间进行选择是后续帖子的主题。
摘要
R中可重现的代码可以带来更好的分析和协作。您可以使用参数化的R Markdown报告来创建复杂的交互式仪表板。通过RStudio Connect安全地托管这些仪表板,您可以控制访问,分发和处理数据。您可以使用R编程语言以及R Markdown报告和RStudio Connect来构建强大,安全且可管理的企业仪表板。