人工智能如何实现从技术到产品的转化
近年来,人工智能领域出现了很多新应用、新产品,例如,借助自然语言处理技术,微软开发了一款同声传译软件——Skype Translator(实时语音翻译技术);借助计算机视觉技术,格灵深瞳开发了一款能智能识别犯罪的视频监控设备,Face++开发了人脸识别云服务;借助于知识表示、规划和决策技术,反恐秘密武器和认知能力多面手IBM Watson被研发了出来。
微软的Skype Translator同声传译产品
2014年5月,在微软Code代码发布大会上,推出了一款名为Skype Translator的同声传译产品。这款产品是Skype(全球免费的语音沟通软件)联合微软的机器翻译团队共同研发的,其中汇集了机器翻译技术、语言聊天技术和神经网络语言识别技术等,能够实现同声传译。
在Code大会上,相关人员对这款软件进行了测试,让两个不同语种的人借助Skype Translator面对面进行交流,结果二人的交流非常顺畅。借助于Skype Translator,当一人说出一句话时,系统就会开始进行翻译,翻译结果会传达到另一个人的耳中,并以字幕的形式在屏幕上显示出来。借助于这款产品,不同语言、不同口音都能被识别出来,为国际交流提供了极大的便利。
现如今,Skype Translator的开发还处于早期。未来,随着Skype Translator研发的日益深入,世界的交流方式将得以改变。
格灵深瞳的智能视频监控系统
如今,摄像头在监控周边环境安全方面发挥了巨大的作用,但是普通的摄像头监控有两方面缺陷。
一方面,普通的摄像头监控只能记录,不能自动识别,且监控范围、监控场景都有限。例如,要完完全全地监控一个机场,就要安装几万台摄像头,另外还需专门安排几个工作人员负责监控视频。并且,由于监控画面采用轮播机制,视频监控画面会按一定的时间周期自动切换,使得很多信息被忽略,难以达到有效监控的目的。
另一方面,查询历史监控记录很困难。监控视频记录要消耗的硬盘资源非常大,据测算,目前,全球监控视频的存储已经占据了3/4的硬盘资源。举个更为形象的例子,某广场每天的监控视频记录,如果刻录在硬盘中,这些硬盘叠加起来的高度甚至能超过埃菲尔铁塔。面对如此庞大的视频数据,要想依靠人眼搜寻某个画面或者某个人,不仅要耗费大量的人力资源,还要消耗大量的时间,效率极低,效果也不佳。
为了解决这个问题,格灵深瞳,一家于2013年成立的致力于计算机视觉开发的人工智能公司,研发出了智能视频监控系统。
格灵深瞳对三维视觉感知技术进行了深入研究,使智能视频监控系统能对人、物进行精确的检测与跟踪,能对人的动作姿态和运动轨迹进行精确的检测和分析,其中动作姿态包括暴力、跌倒等,人物运动轨迹包括逆行、徘徊等。如果发现异常,系统就会自动发出报警信号提醒安保人员,保证安保人员能够及时发现异常,这就解决了普通监控容易漏掉信息的问题。同时,智能视频监控系统还能借助三维视觉感知技术将人物特征抽离出来,对其进行跟踪、检测和搜索,为画面、人物查询提供极大的方便。
目前,格灵深瞳的智能视频监控系统已经在银行进行了测试。未来,如果该系统能在各领域得到广泛应用,将会有效地改善现存的各种安全问题。
Face++的人脸识别云服务
Face++是一个为用户提供人脸识别云服务的平台。开发者借助于该平台提供的开放的人脸识别云服务,能将面部识别功能引入自己的产品。
产品的研发人员借助Face++提供的离线引擎和API(应用程序接口)接入就能享受到免费的人脸检测、人脸分析及人脸识别服务。首先,借助于人脸检测服务,用户能从众多的图片中快速地搜寻到目标图片;其次,借助于人脸分析服务,用户能通过人脸提取各种信息并进行分析;最后,借助于人脸识别服务,用户能对给定人脸的相似度进行匹配。
Face++的这种人脸检测、识别、分析技术用于美图秀秀等软件,能对人面部需要美化的部位进行精确定位,实现自动美化。当然,这种应用只是人脸识别云服务的初级应用。在高级应用阶段,人脸识别云服务能够帮助用户进行图片搜索。例如,借助于人脸识别云服务,婚介所能够根据用户对另一半的描述在其数据库中进行搜索,找到相匹配的信息,以满足客户需求。而且,Face++和360搜索签订了合作协议,在360图片搜索中用户可以使用人脸识别云服务来搜寻自己要想的图片。
另外,在安全领域,借助人脸识别云服务,Face++推出了一个“云脸应用锁”的应用软件,只需扫描人脸、设置备用密码,就能为需要加密的内容提供保护。在打开这些内容的时候,必须进行人脸识别。通过这款应用,用户的很多隐私信息都能得到有效的保护。
Palantir:CIA(美国中央情报局)的反恐秘密武器
Palantir是一家大数据挖掘分析公司,它将人工智能算法与强大的引擎整合在一起,它能借助引擎对多个数据库进行扫描,借助人工智能算法对数据库信息进行处理,并允许用户对相关信息进行快速浏览。目前,其产品已经被CIA、FBI(美国联邦调查局)、私人调查机构等多种机构所使用。
FBI、CIA等机构的数据库非常多,且数据库中的内容非常丰富,涵盖了包括财务数据、语音资料、DNA样本、各地地图在内的多种信息。要想将这些数据中的信息联系到一起,需要消耗巨大的时间成本和人力成本。并且,即便各个数据库之间建立了联系,不同种类数据的开发应用也面临着较大困难。Palantir所研发的产品就很好地解决了这些问题,将数据库的开发应用变得更加简单。除此之外,对于各种安全问题,Palantir也保持着非常高的敏感度。
Palantir公司这种对数据库的梳理、整合能力,在计算机时代引发了一场革命。现如今,Palantir公司开发的产品成为美国情报机关反恐的必备工具。在“9.11事件”发生之后,Palantir帮助情报人员解决了很多技术难题——从大量的数据中迅速筛选出有用的线索,为反恐工作提供了有力的支持。
目前,除了安全、反恐,Palantir的业务范围也开始向医疗、生物科技、零售、保险等领域渗透,例如,利用Palantir侦破医疗保险诈骗案等。在美国,Palantir公司深受欢迎,其年收入早已超过了10亿美元,且仍在以每年3倍的速度增长,可谓是人工智能领域的楷模。
IBM Watson:认知能力强劲的多面手
Watson是一个庞大的计算机系统,IBM服务器的数量为90台,计算机芯片有360个,Power 7系列处理器(目前RISC架构中功能最强大的处理器)有2880个,其体积相当于10台普通冰箱。这个庞大的计算机系统,其内存容量达15TB,运算速度达80万亿次每秒。
Watson是IBM公司在深度开放域问答系统工程(DeepQA)技术基础上开发的一个计算机系统。借助于DeepQA技术,Watson能读取百万级的页面文本数据,能借助深度自然语言处理技术针对某一问题给出备选答案,能对问题进行有效评估。其系统内部预先设置的100多套算法能在3秒之内给出问题的答案,它能针对某个问题对海量信息进行检索、筛选,并能将其答案以人类语言输出。
为了使Watson实现这些功能,其系统中存储着海量的图书、剧本、新闻、文选等资料。在对题目进行读取之后,Watson就会自动对其资料进行检索,在3秒之内给出答案。
2006年,IBM公司开始致力于Watson系统的研发;2011年2月,Watson系统在危险地带智力抢答游戏中一战成名;2011年8月,Watson系统被引入医疗领域。在医疗肿瘤学领域,Watson收录了众多文本资料,如42种关于肿瘤学的医学期刊、60多万条临床试验的医疗数据、200多万页的文本资料等。在癌症治疗领域,Watson能够在几秒内完成对150多万份患者记录的筛选,其内容包括患者病历、治疗方案和治疗结果等,为癌症治疗提供有效的治疗方案。目前,全球癌症治疗效果排名前三的医院都在使用Watson系统。
2012年3月,Watson系统被引入金融领域,花旗集团是第一位客户。Watson帮助花旗对其用户需求进行分析,对金融、经济和用户数据进行处理,并帮助其构建了极具个性的数字银行,还帮助其搜寻可能发生的金融风险、可能产生的收益以及可能存在的客户需求。
目前,无论是医疗信息、金融信息还是其他的信息都在飞速增长,都为Watson系统的开发应用提供了绝佳的商机。
总之,随着技术的突破性进展,随着各IT巨头在人工智能领域投入的不断增加,人工智能正在快速发展,正在以某些领域为切入点改变着世界,推动世界朝着更好的方向发展。
最新活动更多
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
-
精彩回顾立即查看>> 2024 智能家居出海论坛
-
精彩回顾立即查看>> 【在线会议】多物理场仿真助跑新能源汽车
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论