Awesome R
这里有很多非常不错的R包和工具.
- RStudio - 一个非常强大高效的图形界面开发环境,可以在Windows, Mac, 和Linux运行. 官网:
- Emacs + ESS - ESS是一个emacs文本编辑器的一个统计分析的插件. 官网:
- Sublime Text + R-Box - 一个在Sublime 2/3中使用R语言编程的插件. 官网:
- TextMate + r.tmblundle - TextMate 1/2的插件. 官网:
- StatET - 一个基于Eclipse的R语言IDE. 官网:
- Revolution R Enterprise - 专注于大数据,大规模多处理器的功能,可以对学术用户免费提供和商业使用. 官网:
- R Commander - 一个包括基本图形用户界面的R包. 官网:
- IRkernel - Jupyter的R语言内核. 官网:
- Deducer - 一个菜单驱动的数据分析的GUI工具,类似电子表格数据编辑器. 官网:
- Radiant - 一个使用R语言,独立的基于浏览器接口的业务分析平台,基于Shiny. 官网:
- Vim-R - Vim中R语言插件. 官网:
- Nvim-R - Neovim中R语言插件. 官网:
- JASP - 一个完整的贝叶斯和概念论相关方法的R包,和使用SPSS非常相似。 官网:
- Bio7 - 一个包括创建,科学图像分析和统计分析的IDE. 官网:
- RTVS - Visual Studio中R开发工具. 官网:
- magrittr - 一个R语言高效的管道操作包. 官网:
- pipeR - 多泛型管道的实现. 官网:
- lambda.r - R语言中函数式编程和简单的模式匹配. 官网:
- purrr - 一个高级函数编程语言包. 官网:
- dplyr - 快速数据操作和数据库查询. 官网:
- data.table - 使用短小灵活的语法操作数据. 官网:
- reshape2 - 灵活的数据排列,聚合处理. 官网:
- readr - 一个快速简单的读取表格数据到R中的包. 官网:
- haven - 对导入SPSS,STATA和SAS的文件进行改进. 官网:
- tidyr - 方便对数据进行整理、传播和收集. 官网:
- broom - 将统计分析对象转换成整齐的数据框(一种数据组织和呈现的方式). 官网:
- rlist - 一个操作非规范化数据的工具箱. 官网:
- jsonlite - 一个快速解析JSON文件的包. 官网:
- ff - 设计用来存储大型数据集的数据结构. 官网:
- lubridate - 一组日期和时间函数. 官网:
- stringi - 基于ICU的字符串处理方案. 官网:
- stringr - 基于stringi之上的对字符串处理API. 官网:
- bigmemory - 提供共享内存和内存映射矩阵,同时也包提供额外的工具,包括线性模型.(biglm) 和随机森林 (bigrf). 官网:
- fuzzyjoin - 使用不精确匹配的方式连接表数据. 官网:
- tidyverse - 简单从tidyverse下载和安装包. 官网:
- ggplot2 - 强大的绘图统计和计算图形系统的实现.强烈推荐. 官网:
- ggfortify -一个ggplot2(流行的统计软件包)统一的接口(使用一行代码即可). 官网:
- ggrepel - 排除重叠的文本标签. 官网:
- ggalt - ggplot2额外的坐标系统,几何和统计. 官网:
- ggtree - 可视化和注释的系统树. 官网:
- ggplot2 Extensions - ggplot2扩展显示例子. 官网:
- lattice - 一个强大优雅的高级数据可视化系统. 官网:
- corrplot - 图形显示相关矩阵或一般矩阵。它还包含一些矩阵重新排序算法. 官网:
- rgl - R中3D可视化系统. 官网:
- Cairo - 一个使用cairo组件创建高质量显示输出的R图形包. 官网:
- extrafont - 在R中图像中使用字体的工具. 官网:
- showtext - 让R图形设备显示文本的时候使用系统字体. 官网:
- animation - 一个使用 ImageMagick在R中产生动画图形的工具. 官网:
- gganimate - 用ggplot2创建简单的动画. 官网:
- misc3d - 强大的3D绘图工具. 官网:
- xkcd - 在图表中使用xkcd风格. 官网:
- imager - 一个基于CImg库的图像处理包. 官网:
- d3heatmap - 使用D3绘制互动的热图. 官网:
- DataTables - 将R矩阵或数据框作为交互的HTML表. 官网:
- DiagrammeR - 在R中创建JS图表和流程图. 官网:
- dygraphs - 在R中绘制时间序列数据图形. 官网:
- formattable - 可格式化的数据结构. 官网:
- ggvis - R中交互式的图形处理语法. 官网:
- Leaflet - 一个非常流行的交互式地图JavaScript组件. 官网:
- MetricsGraphics - 可以轻松创建D3散点图、折线图和直方图. 官网:
- networkD3 - D3 JavaScriptR网络图. 官网:
- scatterD3 - D3 互动散点图. 官网:
- plotly - 使用plot.ly进行交互式ggplot2和Shiny绘图. 官网:
- rCharts - 交互式JS绘图. 官网:
- rbokeh - Bokeh的R接口. 官网:
- threejs - 交互式3D散点图和地球仪. 官网:
- timevis - 创建完全交互式的时间轴可视化图形. 官网:
- visNetwork - 使用vis.js类库进行网络可视化. 官网:
- knitr - R中简单的动态报表生成工具. 官网:
- xtable - 将表格导出到LaTeX或者HTML. 官网:
- rapport - 一个R模版系统. 官网:
- rmarkdown - R动态文档工具. 官网:
- slidify - 创建和发布漂亮的html5展示效果. 官网:
- Sweave - 使用R创建LaTeX报表的R包. 官网:
- texreg - 在LaTex和HTML中格式化统计模型. 官网:
- checkpoint - 从检查点快照服务器安装包. 官网:
- brew - 报告模板的生成框架.可以和knitr合并. 官网:
- ReporteRs - 一个生成微软Word, PowerPoint和HTML报表的R包. 官网:
- bookdown - 使用R Markdown编写书籍. 官网:
- ezknitr - 避免使用'knitr'带来的工作目录的痛苦. 官网:
- Web Technologies List - 关于如何使用R和网络的相关信息. 官网:
- shiny - 使用R创建简单的Web交互应用. 官网:
- RCurl - 常规的网络客户端接口 (HTTP/FTP/...) . 官网:
- httr - 使用更加友好的RCurl封装. 官网:
- httpuv - HTTP和WebSocket服务程序. 官网:
- XML - R中生成和解析XML的工具. 官网:
- rvest - 简单的web信息抓取,使用CSSSelect 和 XPath 语法. 官网:
- OpenCPU - HTTP API. 官网:
- Rfacebook - Facebook API. 官网:
- RSiteCatalyst - Adobe 分析服务的R语言客户端. 官网:
- plumber - 一个将现有的R代码转换为API的包. 官网:
- parallel - R语言高性能的并行计算平台. multicore and snow. 官网:
- Rmpi - Rmpi对MPI APIS提供了一个包装过的接口,它也提供一个交互式的R环境. 官网:
- foreach - 使用并行来执行循环. 官网:
- SparkR - R for Spark. 官网:
- DistributedR - 一个来自惠普Vertica Analytics团队的可伸缩的高性能平台. 官网:
- ddR - 提供分布式数据结构,简化了R中的分布式计算. 官网:
- sparklyr - 来自RStudio的Spark接口. 官网:
- Rcpp - Rcpp在R中提供了一个高效的API,使得函数更快执行. 官网:
- Rcpp11 - Rcpp11完全重新设计,以C++11为目标. 官网:
- compiler - 使用JIT提高R代码的速度. 官网:
- rJava - R语言对JAVE接口. 官网:
- jvmr - 集成了R, Java, and Scala. 官网:
- rJython - R语言对Python/Jython的接口. 官网:
- rPython - 允许R调用Python. 官网:
- runr - 在R中运行Julia和Bash. 官网:
- RJulia - R中调用Julia. 官网:
- RinRuby - 一个Ruby库,整合了R用Ruby解释器. 官网:
- R.matlab - 读写mat文件,将R和Matlab连接到一起. 官网:
- RcppOctave -Octave and Matlab的接口. 官网:
- RSPerl - 双向接口,R中调用Perl和在Perl中调用R. 官网:
- V8 - 嵌入JavaScript引擎. 官网:
- htmlwidgets - R中把JavaScript数据可视化的最好方法. 官网:
- rpy2 - Python对R的接口. 官网:
- RODBC - R中ODBC数据库范围. 官网:
- DBI - 在R和数据库管理系统之间定义一个公共的接口. 官网:
- elastic - Elasticsearch HTTP API的包装器. 官网:
- mongolite - R中Mongo客户端. 官网:
- RMySQL - R语言的MySQL数据库接口. 官网:
- ROracle - R中Oracle数据库的接口. 官网:
- RPostgreSQL - R语言的PostgreSQL数据库系统接口. 官网:
- RSQLite - R语言SQLite数据库接口. 官网:
- RJDBC - 通过JDBC接口访问数据库. 官网:
- rmongodb - R中MongoDB驱动. 官网:
- rredis - R中Redis驱动. 官网:
- RCassandra -Apache Cassanda直接接口(不是JAVA),提供了最多的基本功能. 官网:
- RHive - 通过Apache Hive的R扩展促进分布式计算. 官网:
- RNeo4j - Neo4j图形数据库驱动. 官网:
- AnomalyDetection - 来自Twitter的AnomalyDetection R包. 官网:
- ahaz - 半参数添加风险回归的正则化. 官网:
- arules - 挖掘关联规则和频繁项集. 官网:
- bigrf - 大随机森林:大型数据集的分类和回归森林. 官网:
- bigRR - 广义回归(特殊是在p >> n情况下). 官网:
- bmrm - 风险最小化方案的正规化方法. 官网:
- Boruta - 所有相关的特征选择算法的一个封装 . 官网:
- BreakoutDetection - Breakout Detection via Robust E-Statistics from Twitter.[暂时不明真相] 官网:
- bst - 梯度增加. 官网:
- CausalImpact - 利用贝叶斯时间序列结构模型进行因果推断. 官网:
- C50 - C5.0决策树和基于规则的模型. 官网:
- caret - 分类和回归训练. 官网:
- Clever Algorithms For Machine Learning
- CORElearn - 分类、回归、特征评价和排序. 官网:
- CoxBoost - Cox models by likelihood based boosting for a single survival endpoint or competing risks. 官网:
- Cubist - 规则和基于实例的回归建模. 官网:
- e1071 - Misc统计函数 (e1071),主要功能有类别分析、傅里叶变换,模糊聚类,支持向量机,最短路径计算,朴素贝叶斯分类器等等. 官网:
- earth - 多元自适应回归模型. 官网:
- elasticnet - 稀疏估计和稀疏主成分分析. 官网:
- ElemStatLearn - 书籍"The Elements of Statistical Learning, Data Mining, Inference, and Prediction"中的数据集,函数和例子. 官网:
- evtree - 全局最优树的进化学习. 官网:
- forecast - 使用ARIMA, ETS, STLM, TBATS,和神经网络进行时间序列预测. 官网:
- forecastHybrid - 使用"forecast"包对ARIMA, ETS, STLM, TBATS,和神经网络模型进行交叉检验. 官网:
- FSelector - 一个基于subset-search或特性排名方法的特征选择框架. 官网:
- frbs - 使用模糊规则系统处理分类和回归的任务. 官网:
- GAMBoost - 基于广义线性和加法模型. 官网:
- gamboostLSS - GAMLSS方法的改善. 官网:
- gbm - 改善广义线性模型. 官网:
- glmnet - Lasso 和 elastic-net正规化广义线性模型. 官网:
- glmpath - L1 Regularization Path for Generalized Linear Models and Cox Proportional Hazards Model. 官网:
- GMMBoost - 广义混合模型. 官网:
- grplasso - Fitting user specified models with Group Lasso penalty. 官网:
- grpreg - Regularization paths for regression models with grouped covariates. 官网:
- h2o - Deeplearning, Random forests, GBM, KMeans, PCA, GLM. 官网:
- hda - 异方差判别分析. 官网:
- ipred - 预测器改进. 官网:
- kernlab - kernlab: 基于内核学习的机器实验室. 官网:
- klaR - 分类和可视化. 官网:
- kohonen - 监督和非监督自组织映射. 官网:
- lars - Least Angle Regression, Lasso and Forward Stagewise. 官网:
- lasso2 - L1 constrained estimation aka ‘lasso’. 官网:
- LiblineaR - 基于C/C++库的线性预测模型. 官网:
- lme4 - Mixed-effects models. 官网:
- LogicReg - 逻辑回归模型. 官网:
- maptree - 映射、修剪和图形树模型. 官网:
- mboost - Model-Based Boosting. 官网:
- Machine Learning For Hackers
- mvpart - Multivariate partitioning. 官网:
- MXNet - MXNet brings flexible and efficient GPU computing and state-of-art deep learning to R. 官网:
- ncvreg - Regularization paths for SCAD- and MCP-penalized regression models. 官网:
- nnet - eed-forward Neural Networks and Multinomial Log-Linear Models. 官网:
- oblique.tree - Oblique Trees for Classification Data. 官网:
- pamr - Pam: 小矩阵预测分析. 官网:
- party - A Laboratory for Recursive Partytioning. 官网:
- partykit - A Toolkit for Recursive Partytioning. 官网:
- penalized - L1 (lasso and fused lasso) and L2 (ridge) penalized estimation in GLMs and in the Cox model. 官网:
- penalizedLDA - Penalized classification using Fisher's linear discriminant. 官网:
- penalizedSVM - 使用惩罚函数的特征选择支持向量机. 官网:
- quantregForest - quantregForest: Quantile Regression Forests. 官网:
- randomForest - 随机森林: Breiman and Cutler's random forests for classification and regression. 官网:
- randomForestSRC - randomForestSRC: Random Forests for Survival, Regression and Classification (RF-SRC). 官网:
- rattle - 图形界面式的数据挖掘工具. 官网:
- rda - Shrunken Centroids Regularized Discriminant Analysis. 官网:
- rdetools - Relevant Dimension Estimation (RDE) in Feature Spaces. 官网:
- REEMtree - Regression Trees with Random Effects for Longitudinal (Panel) Data. 官网:
- relaxo - Relaxed Lasso. 官网:
- rgenoud - R version of GENetic Optimization Using Derivatives. 官网:
- rgp - R基因编程框架. 官网:
- Rmalschains - 使用本地文化基因算法进行连续问题优化.[这里翻译不准]. Search Chains (MA-LS-Chains) in R. 官网:
- rminer - 在分类和回归问题中简单的使用数据挖掘方法(如神经网络和支持向量机). 官网:
- ROCR - 可视化评分分类器的性能. 官网:
- RoughSets - 使用粗糙集和模糊粗糙集理论进行数据分析. 官网:
- rpart - Recursive Partitioning and Regression Trees. 官网:
- RPMM - Recursively Partitioned Mixture Model. 官网:
- RSNNS - Neural Networks in R using the Stuttgart Neural Network Simulator (SNNS). 官网:
- Rsomoclu - Parallel implementation of self-organizing maps. 官网:
- RWeka - Weka的R接口(Weka是基于JAVA环境下开源的机器学习以及数据挖掘软件). 官网:
- RXshrink - RXshrink: Maximum Likelihood Shrinkage via Generalized Ridge or Least Angle Regression. 官网:
- sda - Shrinkage Discriminant Analysis and CAT Score Variable Selection. 官网:
- SDDA - Stepwise Diagonal Discriminant Analysis. 官网:
- SuperLearner and subsemble - Multi-algorithm ensemble learning packages. 官网:
- svmpath - svmpath: the SVM Path algorithm. 官网:
- tgp - Bayesian treed Gaussian process models. 官网:
- tree - 分类和回归树. 官网:
- varSelRF - 使用随机森林进行变量选择. 官网:
- xgboost - eXtreme Gradient Boosting Tree model, well known for its speed and performance. 官网:
- text2vec - 一个快速文本挖掘框架。 Fast Text Mining Framework for Vectorization and Word Embeddings. 官网:
- tm - 一个全面的文本挖掘框架. 官网:
- openNLP - Apache OpenNLP工具接口. 官网:
- koRpus - 一个文本分析的R包. 官网:
- zipfR - 词频分布统计模型. 官网:
- NLP - 基本自然语言处理功能. 官网:
- LDAvis - 主题模型的交互式可视化. 官网:
- topicmodels - Topic modeling interface to the C code developed by by David M. Blei for Topic Modeling (Latent Dirichlet Allocation (LDA), and Correlated Topics Models (CTM)). 官网:
- syuzhet - Extracts sentiment from text using three different sentiment dictionaries. 官网:
- SnowballC - Snowball stemmers based on the C libstemmer UTF-8 library. 官网:
- quanteda - 文本数据的定量分析. 官网:
- Topic Models Resources - 主题模型的学习和R相关资源. 官网:
- NLP for - NLP related resources in R. @Chinese. 官网:
- coda - 输出MCMC(马尔可夫链蒙特卡尔理论)的分析和诊断信息. 官网:
- mcmc - 马尔可夫链蒙特卡尔理论(MCMC). 官网:
- MCMCpack - 马尔可夫链蒙特卡尔理论 (MCMC). 官网:
- R2WinBUGS - 在在R/S-PLUS中打开WinBUGS 和 OpenBUGS. 官网:
- BRugs - OpenBUGS MCMC 软件的R接口. 官网:
- rjags - JAGS MCMC组件的R接口. 官网:
- rstan - Stan MCMC软件的R接口. 官网:
- minqa - Derivative-free optimization algorithms by quadratic approximation. 官网:
- nloptr - 一个免费开源的非线性最优化程序包. 官网:
- lpSolve - Lp_solve解决线性和整形问题的R接口. 官网:
- quantmod - 定量金融模型和交易框架. 官网:
- TTR - 技术交易规相关的数据和功能函数. 官网:
- PerformanceAnalytics - 计量经济学性能和风险分析工具. 官网:
- zoo - S3 Infrastructure for Regular and Irregular Time Series. 官网:
- xts - 可扩展的时间序列. 官网:
- tseries - 金融时间序列分析和计算. 官网:
- fAssets - 金融资产分析和建模. 官网:
- Bioconductor - 用于分析和理解高通量基因组数据的工具. 官网:
- genetics - 处理基因数据的R包. 官网:
- gap - 一个人口家庭遗传数据分析的综合工具. 官网:
- ape - 分子系统学和进化分析. 官网:
- pheatmap - 一个使用简单的热图工具. 官网:
- ddpcr - Analysis and visualization of Droplet Digital PCR data. 官网:
- Network Analysis List - 网络分析相关资源. 官网:
- igraph - 一个网络分析工具集合. 官网:
- network - 一个操作数据关系的基本工具. 官网:
- sna - 基本的网络测量和可视化工具. 官网:
- netdiffuseR - 网络扩散的分析工具. 官网:
- networkDynamic - 支持动态和时序网络. 官网:
- ndtv - 构建动画的可视化动态网络工具,支持多种数据格式. 官网:
- statnet - 大量网络数据的分析,仿真和可视化工具. 官网:
- ergm - 指数随机图模型. 官网:
- latentnet - Latent position and cluster models for network objects. 官网:
- tnet - Network measures for weighted, two-mode and longitudinal networks. 官网:
- rgexf - 从R导出网络对象到GEXF, for manipulation with network software like Gephi or Sigma. 官网:
- visNetwork - 使用vis.js类库进行网络可视化. 官网:
19.R 开发
- Package Development List - 提高整体开发能力的包. 官网:
- devtools - 然R开发人员的生活变得更简单的工具. 官网:
- testthat - 一个R包测试工具. 官网:
- R6 - simpler, faster, lighter-weight alternative to R's built-in classes. 官网:
- pryr - Make it easier to understand what's going on in R. 官网:
- roxygen - 在函数定义中描述说明. 官网:
- lineprof - R中在线分析结果可视化. 官网:
- packrat - 让R项目更加简单,便携和可重构的工具. 官网:
- installr - R中按照软件的相关函数(Windows平台). 官网:
- import - R的导入机制. 官网:
- modules - 另外一个R模块系统(Python风格). 官网:
- Rocker - R configurations for Docker. 官网:
- RStudio Addins - RStudio插件列表. 官网:
- drat - Creation and use of R repositories on 使用R在GitHub或其他平台创建和使用仓储. 官网:
- covr - Test coverage for your R package and (optionally) upload the results to coveralls or codecov. 官网:
- lintr - R静态代码分析. 官网:
- staticdocs - 为一个R包生成静态html文档. 官网:
- futile.logger - R中类似log4j的日志记录包. 官网:
- log4r - R中的log4j接口. 官网:
- logging - 一个在R中实现log4j的日志处理包. 官网:
- engsoccerdata - 英国和欧洲联赛结果数据(1871-2016年). 官网:
- gapminder - 从Gapminder摘录的数据集. 官网:
- git2r - 在R中使用git. 官网:
- CXXR - Refactorising R into C++. 官网:
- fastR - FastR is an implementation of the R Language in Java atop Truffle and Graal. 官网:
- incanter - Clojure-based, R-like statistical computing and graphics environment for the JVM with Lisp spirit. 官网:
- pqR - 一个更快的R实现. 官网:
- renjin - 一个基于JVM的R编译器. 官网:
- rho - Refactor the interpreter of the R language into a fully-compatible, efficient, VM for R. 官网:
- riposte - 一个R快速编译和JIT工具. 官网:
- RRO - R革命性开放平台(Microsoft R Open). 官网:
- TERR - R的TIBCO企业运行环境. 官网:
- swirl - 一个在R控制台中交互式学习指南. 官网:
- DataScienceR - 一个数据科学,神经网络,和机器学习的指南. 官网:
25.1 网站
- R-project - R 项目的官方网站. 官网:
- R Bloggers - R语言的一个综合性博客网站. 官网:
- DataCamp - 在线学习R数据分析. 官网:
- Quick-R - 一个非常好的快速参考手册. 官网:
- Advanced R - 书籍高级R编程的在线版. 官网:
- Efficient R Programming - 书籍"Efficient R Programming"的在线主页. 官网:
- CRAN Task Views - CRAN包的任务列表. 官网:
- The R Programming Wikibook - 一个R协作手册 官网:
- R-users - R语言的求职板块. 官网:
- R Cookbook - 一个R问答网站,由[R Graphics Cookbook]进行支持( 官网:
- tryR - 快速开始使用R. 官网:
- RDocumentation - 使用RDocumentation搜索所有的CRAN, Bioconductor, Github包和文档. 官网:
25.2 书籍
- R Books List - R相关书籍清单. 官网:
- The Art of R Programming - 一个很好的资源,可以系统地学习基础类型的对象,控制语句,变量的范围,以及调试等. 官网:
- Free Books - CRAN贡献的多种语言文档. Contributed Documentation in many languages. 官网:
- R Cookbook - 快速简单的介绍R及相关常见的统计任务. 官网:
- Johns Hopkins编写的数据科学专业的一部分教程:
- Exploratory Data Analysis with R - 基本的各种数据分析技能. * R Programming for Data Science - 依赖于R的一些高级数据分析. * Report Writing for Data Science in R - R语言的报表生成和可重用组件研究. 官网:
- R Packages - 一个用R包编写的书籍 (有论文和网站2钟格式). 官网:
- R in Action - 一本旨在帮助所有级别R用户的书籍. 官网:
- Use R! - This series of inexpensive and focused books from Springer publish shorter books aimed at practitioners. Books can discuss the use of R in a particular subject area, such as Bayesian networks, ggplot2 and Rcpp. 官网:
- R for SAS and SPSS users - 一个对已经熟悉SAS和SPASS用户的资源库. 官网:
- An Introduction to R - 一个很好的介绍R的文章,也涵盖了一些高级主题. 官网:
- Introduction to Statistical Learning with Application in R - A simplified and "operational" version of The Elements of Statistical Learning. Free softcopy provided by its authors. 官网:
- The R Inferno - Patrick Burns gives insight into R's ins and outs along with its quirks! 官网:
- R for Data Science - Free book from RStudio developers with emphasis on data science workflow. 官网:
25.3 博客
Not So Standard Deviations - 数据科学博客
R World News - R行业的社区新闻,可以让你与时俱进.
- @Bob Rudis and @Jay Jacobs.