什么是大数据?学习大数据有什么要求?

2017-02-24  本文已影响0人  zxqwan0430

什么是大数据?学习大数据有什么要求?

大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。具体了解成都中软卓越http://cd.cdzrgj.com/

学习大数据先从基础Java开始学起(大数据支持很多开发语言,但企业用的最多的还是Java),接下来学习数据结构、Linux系统操作、关系型数据库,夯实基础之后,再进入大数据的学习。

大数据技术的具体内容?

分布式存储计算架构(强烈推荐:Hadoop)

分布式程序设计(包含:Apache Pig或者Hive)

分布式文件系统(比如:Google GFS)

多种存储模型,主要包含文档,图,键值,时间序列这几种存储模型(比如:BigTable,Apollo, DynamoDB等)

数据收集架构(比如:Kinesis,Kafla)

集成开发环境(比如:R-Studio)

程序开发辅助工具(比如:大量的第三方开发辅助工具)

调度协调架构工具(比如:Apache Aurora)

机器学习(常用的有Apache Mahout 或 H2O)

托管管理(比如:Apache Hadoop Benchmarking)

安全管理(常用的有Gateway)

大数据系统部署(可以看下Apache Ambari)

搜索引擎架构( 学习或者企业都建议使用Lucene搜索引擎)

多种数据库的演变(MySQL/Memcached)

商业智能(大力推荐:Jaspersoft )

数据可视化(这个工具就很多了,可以根据实际需要来选择)

上一篇下一篇

猜你喜欢

热点阅读