大数据-----初见

2019-02-20  本文已影响0人  梅花九弄丶

什么是大数据?


大数据是不能用传统的计算技术处理的大型数据集的集合。它不是一个单一的技术或工具,而是涉及的业务和技术的许多领域。

在大数据会发生什么


大数据包括通过不同的设备和应用程序所产生的数据。下面给出的是一些在数据的框架下的领域。

大数据的好处


大数据技术


大数据的技术是在提供更准确的分析,这可能影响更多的具体决策导致更大的运行效率,降低成本,并减少了对业务的风险。
为了利用大数据的力量,需要管理和处理实时结构化和非结构化的海量数据,可以保护隐私和安全的基础设施。
目前在市场上的各种技术,从不同的供应商,包括亚马逊、IBM,微软等来处理大数据。尽管找到了处理大数据的技术,研究了以下两类技术:

操作大数据

这些包括像MongoDB系统,提供业务实时的能力,这里是数据捕获和存储互动工作。
NoSQL大数据系统的设计充分利用已经出现在过去的十年,而让大量的计算,以廉价,高效的运行新的云计算架构的优势。这使得运营大数据工作负载更容易管理,更便宜,更快的实现。
一些NoSQL系统可以提供深入了解基于使用最少的编码无需数据科学家和额外的基础架构的实时数据模式。

分析大数据

这些包括,如大规模并行处理(MPP)数据库系统和MapReduce提供用于回顾性和复杂的分析,可能触及大部分或全部数据的分析能力的系统。
MapReduce提供分析数据的基础上,MapReduce可以按比例增加从单个服务器向成千上万的高端和低端机的互补SQL提供的功能,这是系统的一种新方法。
这两个类技术是互补的,并经常一起部署。

操作分析系统

操作 分析
等待时间 1ms-100ms 1min-100min
并发 1000- 100,00 1-10
访问模式 写入和读取 读取
查询 选择 非选择性
数据范围 操作 回溯
最终用户 顾客 数据科学家
技术 NoSQL MapReduce,MPP数据库

大数据的挑战

大数据相关的主要挑战如下:

上一篇下一篇

猜你喜欢

热点阅读