精选 | 2018年4月R新包推荐
作者:Joseph Rickert
翻译:黄小伟,先后从事游戏、社交及金融数据研究及应用,目前就职网易杭州
2018年4月份,共有约212个R新包收录于CRAN,本文选摘了其中40个R包加以功能简述,有需要的爱好者可以自行下载帮助文档并安装R包进行使用。本文主要包括以下几个类别:计算方法、数据、数据科学、机器学习、音乐、科学、统计、时间序列、工具和可视化等.
一. 计算方法
- diffeqr : 支持对微分方程计算工具的调用接口(DifferentialEquations.jl),提供了针对常微分方程(ODE)、随机微分方程(SDE)、时滞微分方程(DDE)、微分代数方程(DAE)等方程的高性能方法.
- SimRepeat : 提供模拟统计方程的相关系统的功能,其中该方程可具有多种变量类型.
二. 数据
-
echor : 提供美国环境保护局(EPA)环境合规历史在线(ECHO) 数据的访问接口.
-
essurvey : 支持从欧洲社会调查(European Social Survey)下载所需数据.
-
malariaAtlas : 支持从疟疾地图集项目(Malaria Atlas Project)服务器下载公共可用数据,并对其进行可视化分析.访问地址:https://map.ox.ac.uk/
- salesforcer : 提供 Salesforce平台的访问接口.
三. 数据科学
-
mleap : 为MLeap提供了一个sparklyr扩展,这是一个开放源码库,可以导出Apache Spark管道.
-
rdfp : 提供谷歌DFP( DoubleClick for Publishers)的访问接口.
访问地址:https://developers.google.com/doubleclick-publishers/
- workflowr : 提供了支持可重复性操作和团队协作的数据科学实施框架.
四. 机器学习
-
aws.translate : 支持将一种语言的文本输入转换成另一种语言的文本输出(AWS Translate).
-
CBDA : 实现一个集合预测器(“超级学习者”),使用基于过滤和全面感知的方法对大数据进行分类.
-
featurefinder : 通过使用rpart分类和回归树对模型残差进行详细分析,实现了一种用于查找模型特征的方法.
-
iilassso : 用可独立解释的Lasso实现用于拟合线性、逻辑回归模型的高效算法.
- live : 通过了解关键因素,实施解释复杂机器学习模型的方法,
详见 Ribeiro et al. (2016) and Staniak and Biecek (2018).
image- mlrCPO : 提供了一套工具集,使得mlr(机器学习框架)更为丰富,可兼容多种预处理操作符(CPOS).
7. varrank : 提供用于执行变量排序和特征选择的计算工具箱.
五. 音乐
1. tabr : 支持通过R代码利用乐谱软件(LilyPond)创建吉他谱的功能,可根据标记语言生成高品质的乐谱.
image六. 科学
1. DrInsight : 使用基于连接性测绘的药物重复利用工具,能够反向查询疾病表型或者查询与所查询药物具有类似功能的药物.
image七. 统计
1. cultevo : 提供测量信号系统组成的工具:信息论测量(2016)、距离矩阵相关性的Mantel检验(1983)等.
2. indirect : 提供使用独立的条件均值先验值的贝叶斯广义线性模型的函数.
3. konfound : 实现了反映灵敏度分析最新进展的方法,包括计算稳健性指数的函数.
4. mgc : 实现多等级图关联(MGC),在2017年由Shen等人开发.
image5. netregR : 提供将网络响应(有向和无向)回归到可能为演员、关系或网络值等感兴趣的协变量,并提供计算系数方差估计值的函数.
image6. RNGforGPD : 提供生成遵循广义泊松分布的单变量和多变量数据的函数.
7. SmartEDA : 提供自动描述数据结构和关系的功能,以便于探索性数据分析.
image8. stratifyR : 采用Khan等人的方法对单变量人群实施分层抽样设计.
9. WeMix : 提供运行混合效果模型的功能,其中包括每个级别的权重。遵循Rabe-Hesketh等人所提出的方法(2006),利用自适应正交的方法进行模型训练.
八. 时间序列
1. anomalize : 实现一个“整洁”工作流程,用于检测时间序列数据中的异常情况,支持分解时间序列、检测异常和将多个时间序列的正常数据与异常数据进行分离等功能.
image2. LPWC : 提供函数-基于加权相关和引入滞后,进行时间序列的距离度量.
九. 工具
1. table1 : 提供用于创建用于描述性统计的HTML表格的功能.
image2. foolbox : 提供一个操作函数的框架,并使用元编程来翻译.
3. graphframes : 提供了sparklyr包的扩展,提供了基于DataFrame的接口来处理图形.
4. komaletter : 提供用于书写字母的多功能R Markdown模板.
5. pkgnet : 使用图论的工具来分析R包中的函数与其导入的包之间的依赖关系,并量化它们的复杂性等.
6. promises : 提供了在R中进行异步编程的基本抽象.
十. 可视化
1. ERSA : 提供函数对回归计算的结果进行展示,同时该功能可以集成到shiny中进行可视化显示.
image2. ggplotify : 提供了将绘图函数调用转换为grob或ggplot的方法,使用户可以对齐由基本图形、网格、点阵和vcd函数生成的绘图.
image3. ggstatsplot : 对ggplot2进行扩展,生成带有统计试验结果的可视化图形.
image4. panelView : 提供使用二分法处理可视化面板数据的功能.
image5. prepplot : 提供一个单独的函数,用于创建基础绘图区域,可以轻松制作自定义图形.
image说明:限于个人水平,错误在所难免,欢迎批评指正、交流!