精选| 2020年2月R新包推荐(第39期)
译:黄小伟,资深数据从业者。目前就职杭州有赞数据分析团队,欢迎加入!邮箱:huangxiaowei@youzan.com
2020年2月份,164个R新包收录于CRAN(2020年1月份收录147个),累计收录15,978个R包!由于CRAN会不定时进行R包增删,所以具体数量会随时间略有变化。此次整理了十一个类别,分别为数据、计算方法、基因组学、机器学习、数学、医学、科学、统计学、时间序列、效率工具和可视化工具。以下是本期(总第39期)R新包的核心功能介绍:
01.数据
1. crsmeta: 提供从各种数据格式获取坐标系元数据的功能,包括:CRS、EPSG、PROJ4和WKT.2. danstat: 提供丹麦统计局数据库API的接口.3. osfr: 实现与OSF交互的接口,使用户能够访问开放的研究材料和数据,或创建和管理私有/公共项目.
02.计算方法
1. delayed: 支持以优化计算资源的方式并行化相关任务.
image2. tergmLite: 支持利用tergm包,实现时间指数随机图模型框架估算的动态网络.
03.基因组学
1. selectSNPs: 提供一种使用统一的局部函数来选择低密度snp的方法.
image2. varitas: 实现针对目标分析序列数据的多调用者变异分析管道.
04.机器学习
1. autokeras: 提供AutoKeras的接口,它是一个用于自动机器学习的开源软件库.
2. MTPS: 根据Xing等人描述的改进叠加算法,实现同时预测多个结果的功能.
3. quanteda.textmodels: 实现基于表示文本数据的稀疏矩阵对象的模型和分类器缩放方法.
4. SeqDetect: 实现克拉科夫、Vrdoljak和Mustique(2019)中的自动机模型,以检测和处理序列.
image5. studyStrap: 实现多学习算法,如合并、学习特定集合(在观察到的学习集合上训练),提供超过20种相似性度量方法.
05.数学
1. PlaneGeometry: 基于R6 Class,支持表示三角形、圆、圆弧、椭圆、椭圆弧和直线、绘图方法、转换等功能.
image06.医学
1. beats: 提供从UFI设备导入数据和处理心电图(ECG)数据的功能.
2. NMADiagT: 实现了Ma等人提出的分层总结式接收机工作特性模型和Lian等人开发的层次模型.
3. SAMBA: 通过多种方法,如Beesley&Mukherjee(2020)所建议的,利用电子健康记录数据和错误分类的EHR衍生疾病状态,获得偏差校正点估计和有效标准误差.
07.科学
1. baRUlho: 提供有助于(动物)声音传输实验的声学分析的功能,包括数据准备、分析和可视化功能.
image2. CBSr: 用单调约束三次Bezier样条逼近跨期选择和风险选择数据中的潜在效用函数.
image08.统计学
1. blockCV: 提供用于在空间结构环境中创建空间或环境分离褶皱以进行交叉验证的功能,同时包括用于可视化空间自相关的有效范围以分离训练和测试数据集的方法,如Valavi,R.等人所述.
image2. BGGM: 实现最近在Williams(2019)、Williams&Mulder(2019)和Williams等人中引入的贝叶斯高斯图形模型的拟合方法.
3. metagam: 提供一种执行广义可加模型和广义可加混合模型的元分析的方法,包括从使用mgcv和gamm4包计算的模型中删除单个参与者数据的功能.
image4. MKpower: 为韦尔奇和Hsu t试验、威克森秩和试验和诊断试验提供功率分析和样本量计算功能.
5. mvrsquared: 实现一种计算N维结果确定系数的方法.
6. pdynmc: 提供基于Holtz Eakin等人(1988)、Ahn&Schmidt(1995)和Arellano&Bover(1995)提出的线性和非线性力矩条件的线性动态面板数据模型函数.
7. Superpower: 提供模拟最多三个因素的方差分析设计、计算所有主要影响和相互作用的观测功率和平均观测效应大小的功能.
8. tune: 提供与其他tidymodels包一起使用的函数和类,用于在模型、预处理方法和后处理步骤中查找超参数的合理值.
9. xrnet: 支持拟合Weaver&Lewinger(2019)所述的分层正则回归模型.
09.时间序列
1. seer: 实现了一个基于从时间序列计算出的特征,进而选择时间序列预测模型的框架.
2. testcorr: 提供计算单变量时间序列中自相关显著性、双变量时间序列中互相关显著性、多变量序列中皮尔逊相关显著性和单变量序列i.i.d.特性的测试统计量的功能,如Dalla等人所述.
10.效率工具
1. bioC.logs: 支持从http://BioConductor.org获取、下载统计数据.
2. matricks: 提供帮助创建复杂矩阵和绘图的函数.
image3. rco: 提供自动应用不同策略优化R代码的功能。这些函数以R代码作为输入,并返回R代码作为输出.
4. slider: 在任何R数据类型上提供类型稳定的滚动窗口函数,并支持累积窗口和扩展窗口.
5. taxadb: 提供对分类数据的快速、一致的访问,并支持常见任务,例如将分类名称解析为标识符和查找给定物种的更高分类等级.
6. tidyfst: 提供了一个以data.table为后端的整洁数据操作动词工具包,结合了dplyr语法优雅和data.table计算性能的优点.7. tidytable: 提供与data.table兼容的rlang接口.
11.可视化工具
1. iNzightTools: 对iNZight主要通用变量和数据集处理工作流提供封装,iNZight是一个图形用户界面,可为学生轻松浏览和可视化数据.
2. IPV: 提供用于生成项池可视化的函数,这些可视化用于显示一组项的概念结构.
3. spacey: 提供实用程序下载USGS和ESRI地理空间数据,并为美国的位置生成高质量的光线着色图.
4. Tendril: 提供计算和显示卷须图的函数.
5. tidyHeatmap: 提供基于整洁数据框的Bioconductor ComplexHeatmap包的实现.
说明:限于个人水平,错误之处难免,烦请批评指正,共同交流~