干货！一文读懂AI计算机视觉技术，“视觉五虎将”值得关注

2018-09-12 10:24

AI圈子联盟

关注

作为人工智能的关键领域之一的计算机视觉近期再次成为了热点，那么你真的了解什么是计算机视觉吗？

干货！一文读懂计算机视觉，“视觉五虎将”值得关注

一、什么是计算机视觉？

计算机视觉，英文Computer Vision，简称CV。计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等。

二、计算机视觉和机器视觉有何区别？

事实上，二者经常会被混淆，甚至有些“专家”也没分清。

简单的说，二者最大的区别，在于技术要求的侧重点不一样，甚至差别很大。计算机视觉（CV），主要是对质的分析，比如分类识别，这是一个杯子那是一条狗。或者做身份确认，比如人脸识别，车牌识别。或者做行为分析，比如人员入侵，徘徊，遗留物，人群聚集等。

机器视觉（MV），主要侧重对量的分析，比如通过视觉去测量一个零件的直径，一般来说，对准确度要求很高。

三、计算机视觉主要任务是什么？

计算机视觉的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的信息。计算机视觉任务的主要类型有以下几种：

1、物体检测

物体检测是视觉感知的第一步，也是计算机视觉的一个重要分支。物体检测的目标，就是用框去标出物体的位置，并给出物体的类别。

物体检测和图像分类不一样，检测侧重于物体的搜索，而且物体检测的目标必须要有固定的形状和轮廓。图像分类可以是任意的目标，这个目标可能是物体，也可能是一些属性或者场景。

2、物体识别（狭义）

计算机视觉的经典问题便是判定一组图像数据中是否包含某个特定的物体，图像特征或运动状态。这一问题通常可以通过机器自动解决，但是到目前为止，还没有某个单一的方法能够广泛的对各种情况进行判定：在任意环境中识别任意物体。

现有技术能够也只能够很好地解决特定目标的识别，比如简单几何图形识别、人脸识别、印刷或手写文件识别，或者车辆识别。而且这些识别需要在特定的环境中，具有指定的光照，背景和目标姿态要求。

3、图像分类

一张图像中是否包含某种物体，对图像进行特征描述是物体分类的主要研究内容。一般说来，物体分类算法通过手工特征或者特征学习方法对整个图像进行全局描述，然后使用分类器判断是否存在某类物体。

图像分类问题就是给输入图像分配标签的任务，这是计算机视觉的核心问题之一。这个过程往往与机器学习和深度学习不可分割。

4、物体定位

如果说图像识别解决的是what，那么，物体定位解决的则是where的问题。利用计算视觉技术找到图像中某一目标物体在图像中的位置，即定位。

目标物体的定位对于计算机视觉在安防、自动驾驶等领域的应用有着至关重要的意义。

5、图像分割

在图像处理过程中，有时会需要对图像进行分割来提取有价值的用于后继处理的部分，例如筛选特征点，或者分割一或多幅图片中含有特定目标的部分等。

图像分割指的是将数字图像细分为多个图像子区域（像素的集合，也被称作超像素）的过程。图像分割的目的是简化或改变图像的表示形式，使得图像更容易理解和分析。更精确地说，图像分割是对图像中的每个像素加标签的一个过程，这一过程使得具有相同标签的像素具有某种共同视觉特性。

“图像语意分割”是一个像素级别的物体识别，即每个像素点都要判断它的类别。它和检测的区别是，物体检测是一个物体级别的，他只需要一个框，去框住物体的位置，而通常分割是比检测要更难的问题。

计算机视觉是通过创建人工模型来模拟本由人类执行的视觉任务。其本质是模拟人类的感知与观察的一个过程。这个过程不止识别，而是包含了一系列的过程，并且最终是可以在人工系统中被理解和实现的。

四、“视觉五虎将”都是谁？

目前在计算机视觉领域已经涌现出商汤科技、旷视科技、深兰科技、依图科技、云从科技等一批技术领先的独角兽公司，行业称为“视觉五虎将”，我们对这些公司作个简单介绍。

商汤科技：

公开资料显示，商汤科技成立于2014年11月，是中国一家计算机视觉和深度学习原创技术的创新型科技公司，也是一家知名独角兽企业，致力于引领人工智能核心“深度学习”的技术突破，构建人工智能、大数据分析行业解决方案。

目前，商汤科技已与众多知名战略合作伙伴和大客户建立合作，赋能AI于多个行业，迅速落地包括人脸识别、图像识别、视频分析、无人驾驶、医疗影像识别等各类应用技术。此外，商汤科技以人工智能技术服务于各大安防监控公司、银行金融机构、手机厂商、机器人厂商、多家移动APP厂商以及政府公安等客户。

深兰科技：

深兰科技，2014年由归国博士团队创建，在全球拥有近百位全职博士和博士后学术带头人，几百位名校硕士研发人员，创造性地发明了数十项原创算法和原创技术，团队曾多次获得多项世界大赛和国内大赛的第一名。致力于人工智能基础研究和应用开发。团队利用自主知识产权的深度学习架构、机器视觉、生物智能识别等人工智能算法、无媒介支付等核心技术，在自动驾驶及整车制造、智能机器人、生物智能、AI芯片、智能零售、智慧城市、智慧安防、教育军工等领域都有深入布局，居行业领导地位。

目前，在欧洲、美国、澳洲等多地设立区域总部和分支研发机构，国际销售网络覆盖全球17个国家。拥有包括英特尔在内的6家世界级人工智能企业建立了人工智能、AIoT智联网、人机交互、AI芯片等相关的领域的联合实验室，共同构筑了全球性的研发科研体系，2017年利用机器视觉等技术研发了市场公认的超越Amazon go的takego人工智能无人店技术，2018年发布了全球第一款自动驾驶功能性商用车。

旷视科技：

旷视科技成立于2011年10月，以深度学习和物联传感技术为核心，立足于自有原创深度学习算法引擎Brain＋＋，深耕金融安全，城市安防，手机AR，商业物联，工业机器人五大核心行业。发展至今，旷视已在北京、西雅图、南京设立独立研究院，并在十余个核心城市设立分部。

旷视的核心人脸识别技术Face＋＋曾被美国著名科技评论杂志《麻省理工科技评论》评定为2017全球十大前沿科技，同时公司入榜全球最聪明公司并位列第11名。在中国科技部火炬中心“独角兽”榜单中，旷视排在人工智能类首位。

依图科技：

成立于2012年，公司核心业务包括智能安防平台、智慧健康医疗、城市数据大脑、智能硬件设备等。目前，依图的技术早已经服务全国20余省安防，为海关总署及中国边检等提供人像比对系统，并在招商银行、浦发银行，遗迹互联网金融等多个业务场景中广泛应用，车辆识别产品亦被公安系统广泛采用，依图也是目前国内唯一拥有10亿级人像库比对能力的公司，搭建了全球最大的人像系统，覆盖超过15亿人像。

云从科技：

成立于2015年4月，是一家从中科院重庆研究院孵化的专注于计算机视觉与人工智能的高科技企业。是计算机视觉头部企业中的国家队，承建了国家发改委的基础项目重大工程——“人工智能基础资源公共服务平台”与产业化项目重大工程“人脸识别系统产业化应用平台”。与公安部、四大银行、证通、民航总局建立联合实验室，推动人工智能产品标准的建立，成为唯一同时制定国标、部标、行标的人工智能企业。国家发改委公布的《2017年“互联网＋”重大工程拟支持项目名单》中包含四个AI公司，云从科技是其中唯一一家创业公司。