Gartner发布2019年十大数据与分析技术趋势
今年,我们将看到更多公司和企业开始结合各种新兴信息技术,如AI、区块链等技术趋势。当越来越多的创新公司这样做时,就将经历格式塔转变并从不同的角度看待他们的公司。那些成功遵循这条道路的组织将转变为数据组织。Gartner建议数据和分析领导者与高级业务负责人讨论他们的关键业务优先级,并探索如何针对以下10个主要趋势去实现这些优先级策略布局。
增强分析
数据分析的下一阶段是数据增强分析,为分析计划带来自动化和新的程度的洞察力。
数据分析的下一阶段的根本性转变已经开始了。就像第二波自助商业智能破坏了第一波传统商务智能,第三波增强分析技术将再次改变游戏规则。早期采用增强分析技术的用户,以前所未有的速度洞察力和增强的竞争优势。
增强的分析应用程序通过无偏差的正确准备的数据在右手中提供了惊人的结果。 由于自动化分析依赖于统计技术,因此不足以代表业务流程的不准确,有偏差或质量差的数据将提供低质量的结果。
增强数据管理
随着以云计算,大数据,移动和社交为主要特征的第三平台的发展,数据正在变成企业的核心驱动力,企业对于数据的使用成为其竞争力的核心组成部分。所以企业中产生了越来越多生产数据的拷贝用于备份/恢复,开发测试,统计分析,准业务平台搭建,数据恢复有效性验证等目的。
在当前产业环境下,大量行业用户都已将核心业务迁移到自动化系统,自动化系统的运行往往需要在业务系统中抽取数据,这势必会耗费业务系统的资源,对业务系统的效率、稳定性造成极大影响。而增强数据管理通过对数据管理流程的重塑,实现了简化数据使用、节约存储空间、增强数据管理这几大目标,在降低对业务系统压力的同时,实现更敏捷的数据使用。
持续智能
来自所有数据的持续智能不是描述实时,速度或吞吐量的另一个短语。它是关于从所有数据中获得连续业务价值的无摩擦循环时间。它是一种现代机器驱动的分析方法,无论有多少数据源或数量多大,您都可以快速获取所有数据并加速所需的分析。 它不是一次这样做,而是让机器自动化,因此它是连续的,无摩擦的。
通过使用各种技巧和工具,有很多方法可以快速进行分析。但是,如果它引导您进入一个新的思维链,需要一直回到加载更多数据,建模,集成它并在每次业务出现新问题时调整仪表板。
现在,人工智能驱动的分析已经通过应用当今数据处理平台的巨大力量来自动解释和协调来自不同来源的数据。现在,任何人都可以将AI驱动的分析系统指向复杂的数据源进行推断和协调,系统可以完成工作并立即向业务发送持续的视觉洞察。业务决策的数据变得持续。
可解释的AI
人工智能出现以后,似乎正在逐步渗透到我们生活中的每个角落,其中不乏它为我们做出了一些非常重要的决定,比如,身体里的肿瘤是不是已经发生癌变;是否应该同意或拒绝保险索赔;旅客是不是应该被批准通过机场安检,甚至是否授权导弹发射以及是否批准自动驾驶汽车的制动,等等。
最重要的是,这显然意味着应该提供关于如何获得模型的响应的见解。直接的后果是,由于易于解释,将可能方法的范围缩小到最简单的方法,除非我们找到方法将上下文添加到最先进算法的预测中。更何况,这种趋势更多是因为监管约束的强化而不是缓慢的。
图形分析
图形分析是一个快速发展的研究领域,其中图形理论,统计和数据库技术的组合应用于图形结构数据的建模,存储,检索和性能分析。这些技术使研究人员能够理解网络的结构及其在不同条件下的变化,找到满足不同约束的实体对之间的路径,识别图中的簇或紧密交互的子组,或查找与给定模式类似的子图。
对于这些和许多其他任务,重要的是将一个数据视为表示对象和表示它们之间关系的对象和边的节点或顶点的图(网络)。对于诸如传感器网络的许多应用领域,图形可能很大并且具有十亿个节点和边缘。
可以基于边缘是否具有取向来定向或不定向图形。如果每对顶点通过路径连接,则连接无向图。具有与每个边相关联的权重的图被称为加权图。用于网络分析,基因组学,社交网络分析和其他领域的大规模图形处理的计算要求需要强大且高效的计算性能,只有加速器才能提供。
数据结构/数据网格
数据网格是一种架构和一系列数据服务,可以为内部环境和多云环境中的多种端点提供一致统一的功能。它可简化并集成云端和内部环境的数据管理,有助于加快数字化转型的步伐。它提供一致统一的集成混合云数据服务,用于改善数据可见性和洞察力、据访问和控制,以及数据保护和安全。
面对巨大的压力,IT 主管们迫切需要在有限的时间内,运用有限的技能和预算驾驭当今的海量数据,并利用这些数据为整个企业创造新的价值。 与此同时,数据不再是隐藏在防火墙之后的加密设备上,而是越来越呈现分布式、动态性和多样化的特点,而且数据量惊人,管理起来极为困难。
数据网格最终帮助企业释放数据潜能,满足业务需求并赢得竞争优势。 它可以帮助 IT 部门更充分地发挥混合云的无限潜能,构建下一代数据中心并通过数据管理打造现代化的存储。
NLP/会话分析
NLP是计算机以一种聪明而有用的方式分析,理解和从人类语言中获取意义的一种方式。通过利用NLP,开发者可以组织和构建知识来执行自动摘要,翻译,命名实体识别,关系提取,情感分析,语音识别和话题分割等任务。
目前NLP的方法是基于深度学习,这是一种AI,它检查和使用数据中的模式来改善程序的理解。深度学习模型需要大量的标记数据来训练和识别相关的相关性,汇集这种大数据集是当前NLP的主要障碍之一。
NLP算法通常基于机器学习算法。NLP可以依靠机器学习来自动学习这些规则,而不是手工编码大量的规则集,通过分析一系列的例子(如,一个大的数据库,像一本书,直到一堆句子的集合),并且做一个静态的推论。一般来说,分析的数据越多,模型越精确。社交媒体分析是NLP使用的一个很好的例子。品牌在线跟踪对话以了解客户的意见,并洞悉用户行为。
区块链
区块链与往年的不同之处在于,2019年我们将看到第一批真正的企业应用程序正在使用中。不是在谈论开发分散式应用程序的各种区块链初创公司,也不是在谈论概念证明。在2019年,将看到大公司使用区块链来改善行业协作。
区块链的用户数据隐私保护是一个新方向,接下来预计会看到越来越多的创业者和密码学专家加入了这个行业,投入大量资源进行研究。现在这个方向已经非常明确,通过加密算法保护用户隐私数据,通过区块链激励机制在机构和用户之间分配价值,这是区块链的优势所在。
商业AI和ML
商业供应商现在已经在开源生态系统中构建了连接器,它们提供了扩展AI和ML所需的企业功能,例如项目和模型管理、循环利用、透明度提升,为数据以及开源技术缺乏的平台提供凝聚力和集成。
到2022年,75%利用AI和ML技术的新终端用户解决方案将采用商业解决方案而非开源平台构建。
持久性内存服务器
持久性内存非常适合需要频繁访问大型复杂数据集的环境。持久存储器是内存/存储层次结构的新增功能,可弥补DRAM和存储之间的差距,通过提供更靠近处理器的非易失性,低延迟存储器,实现更大的数据管理灵活性。因为它驻留在DRAM总线上,所以持久存储器可以提供对关键数据的超快速DRAM访问。将传统存储的数据可靠性与超低延迟和高带宽相结合,使设计人员能够以全新的方式优化系统并管理数据。
持久性内存非常适合需要频繁访问大型复杂数据集的环境,以及对因电源故障或系统崩溃导致的停机时间敏感的环境。应用程序包括大数据分析,存储设备,RAID缓存,内存数据库,存储索引的元数据服务器以及在线事务处理。
随着我们进入到未来,存储数据这个基本概念将从铁磁材料颗粒翻转极性变成可直接寻址的异常小的硅片层,可以快速操作和读取。由于硬件在变化,我们使用硬件的方式也应该随之变化。
结尾
2019年将成为真理年。不仅从区块链的角度来看,它为行业合作伙伴提供了单一版本的事实,而且还提供了物联网安全性以及政府和商业组织之间激烈的军备竞赛。总而言之,当我们为以数据为中心的第三个十年做准备时,这将是一个非常激动人心的一年。
今天的大数据分析市场与几年前的市场截然不同,正是由于海量数据的暴增,未来十年,全球各行各业都将发生变革、创新和颠覆。
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论