
我们现在看到,大数据的未来是很清晰并拥有不可动摇的地位,物联网、机器学习、人工智能等技术正在进入我们的日常生活,而所有这些背后,都是大数据在起作用。一些设备通过连接网络相互通信,共享并生成人们需要的数据,还有一些学习模式的算法能从生成的数据中处理信息。物联网最简单的例子就是智能电视,它连接到家庭网络,并生成关于你的观看模式、兴趣等的数据。
以下是一些可能在2020年蓬勃发展的几项重要大数据技术。
边缘计算
物联网除了激发人们对流媒体分析的兴趣外,还激发了人们对边缘计算的兴趣。在某些方面,边缘计算与云计算是相反的。边缘计算系统不是将数据传输到一个集中的服务器进行分析,而是在网络的边缘接近其创建位置对数据进行分析。边缘计算系统的优点是减少了必要的网络传输信息量,从而减少了网络流量和相关成本。它还减轻了对数据中心或云计算设施的需求,释放了其他工作负载的容量,并消除了潜在的单点故障。虽然边缘计算市场,尤其是边缘计算分析市场仍在发展中,但一些分析师和风险投资家已经将这项技术称为“下一个大浪潮”。
流分析
随着企业对大数据分析解决方案的能力越来越熟悉,他们对更快地获得数据分析有了更高要求。对于这些企业来说,流分析(streaming analytics)能够在创建时便对数据进行分析,这是一个好消息。企业们积极寻找各类解决方案,能够满足不同来源的多种信息输入、处理,并立即或尽可能近的收到分析,涉及到新型物联网部署时,这一点尤为可取,它助于推动人们对大数据流分析的兴趣。根据Markets and Markets报告,2016年流分析解决方案带来30.8亿美元的收入,到2021年,这一数字可能会增加到137亿。
人工智能
人工智能通过(使用过去分析任务的结果)学习改变数据分析,这样随着时间的推移,结果会更快更准确。由于有大量的数据可以提取,加上过去查询的分析结果,人工智能将能够根据当前事件提供准确的预测。此外,机器学习将通过识别潜在的问题或人类可能无法发现的问题来增强对业务的分析能力。企业如果没有部署人工智能,将在使用人工智能进行数据分析的方面落后于竞争对手。
内存数据库
企业寻求快速方便地访问数据和分析以便助力各种业务决策,内存计算的采用不断增加。内存计算提高了运营、财务、营销和销售效率所需的分析能力。随着内存计算的改进,它会变得越来越便宜,也越来越容易实现,这使其在未来广泛被采用成为必然。根据Gartner的一份报告,到2021年,内存计算(IMC)市场将突破150亿美元大关。
数据湖
数据发现、目录、虚拟化、受控复制、集成以及所有方面的管理、普遍的安全性、人工智能工具运行、存储和计算以及开源等方面的进展都有助于实现数据湖的概念和愿景。然而,组装下一代数据湖所需的内容并不简单,可能非常耗时,也有一定风险并且费用高昂。注:数据湖的一部分价值是把不同种类的数据汇聚到一起,另一部分价值是不需要预定义的模型就能进行数据分析。现在的大数据架构是可扩展的,并且可以为用户提供越来越多的实时分析。在商业智能(BI)和数据仓库还没有被淘汰的今天,大数据分析和大数据湖正在向更多类型的实时智能服务发展,这些实时的智能服务可以支持实时的决策制定。
区块链
作为前瞻性分析师和风险投资家的最爱,区块链是比特币(数字货币)的基础分布式数据库技术。区块链数据库的独特之处在于,数据一旦写入,就不能在事后删除或更改。此外,它还具有高度的安全性,这使得它成为银行、保险、医疗保健、零售等敏感行业中大数据应用的最佳选择。目前,区块链技术仍处于初级阶段,用例还在开发中。然而,多家初创公司和供应商已经推出了基于区块链技术的实验性或入门性解决方案。
NoSQL数据库(非关系型的数据库)
数据库管理员查询、操作和管理存储在关系数据库管理系统(RDMSes)中的结构化数据,NoSQL数据库存储非结构化数据并提供快速性能。这意味着它在大容量处理各种数据类型时提供了灵活性。NoSQL有如下优点:易扩展, 数据库种类繁多,但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系,这样就非常容易扩展。无形之间也在架构的层面上带来了可扩展的能力。大数据量,高性能,NoSQL数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀。