地震会商技术系统地震数据专家[DataEQ]

DatistEQ之R工作原理

2021-03-09  本文已影响0人  了无_数据科学

怎么能够为大家提供一个非常简洁的,又非常灵活的平台呢?这是多年以来困扰着笔者的一个重大问题。多年前一直偶然的机遇,把R语言环境集成到了DatistEQ中,从此系统就多了经典算法栏目。虽然集成了R语言环境,但笔者鲜有研究,使得经典算法这一栏几乎停留在最初的模样。一种原因是自己对R不了解;另一个自身没有需求。

经典算法栏

直到最近,在研究贝叶斯网络算法过程中,才略有启发。R和DatistEQ的无缝衔接,可以发挥出无限的扩展空间。

R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。

关于R的一个比较准确的描述是:R是一门用于统计计算和作图的语言,它不单是一门语言,更是一个数据计算与分析的环境。统计计算领域有三大工具:SAS、SPSS、S,R正是受S语言和Scheme语言影响发展而来。其最主要的特点是免费、开源、各种各样的模块十分齐全,在R的综合档案网络CRAN中,提供了大量的第三方功能包,其内容涵盖了从统计计算到机器学习,从金融分析到生物信息,从社会网络分析到自然语言处理,从各种数据库各种语言接口到高性能计算模型,可以说无所不包,无所不容,这也是为什么R正在获得越来越多各行各业的从业人员喜爱的一个重要原因。[1]

默认情况下,DatistEQ的安装包中附带了R环境,大家也可以到cran.r-project.org去下载。另外,DatistQE 2021 Q1版可以支持R的4.X版,但测试结果表明,R的4.0.4版具有先天不足,中文支持效果较差。

不同版本的R环境的切换,可在系统设置窗口中设置。

设置R环境的路径

工作原理

R环境和DatistEQ之间,采用的是内存级的数据交换机制。DatistEQ可将数据直接发送到R环境中,R运行结束后,DatistEQ直接从R环境中取回运行结果。

Datist与R环境

示例

示例流程 Test节点中数据

EDA节点中的代码:

if (!require("ggplot2")) install.packages("ggplot2")
library(ggplot2)  
p <- ggplot(inputtable,aes(weight,mpg))+geom_point()
ggsave(gettempfile(), width = 15, height = 10, dpi=300,units = "cm")

第一行,安装组件包,意为R环境不存在ggplot2组件包,将会从网络上下载一个组件包。
下载过程中,弹出的窗口让选服务器,选中China的服务器站点。
如果本地环境中相应的安装包存在,此行可以不要。

指定CRAN镜向地址

第二行,引用组件包。
第三行,调用ggplot绘图。
第四行,保存图像以便于DatistEQ能够获取图像。
其中,inputtable为前节点推入的数据框的名称;gettempfile()为临时文件路径,以便于DatistEQ获得返回结果。

输出结果如下:


输出结果

除inputtable、gettempfile()之外,DatistEQ中还包含几个特定的函数:
header1('文本'),一级标题;
header2('文本'),二级标题;
header3('文本'),三级标题;
boldtext('文本'),加粗文本;
output('文本'),输出文本。

上一篇下一篇

猜你喜欢

热点阅读