飞桨:百度为什么要做深度学习框架?
03
深度学习如何为人所用?
A
中国AI人才之困
蓬勃发展的AI产业到底有多少人才缺口,简直是个玄学问题。
由于笔者拿到的各种统计数据口径过于不一致,所以无法给出一个精确数字。但总体来说,在顶级AI人才上,如果美国的单位是“千”,那中国就是“百”;在高级AI人才上,如果美国的单位是“万”,那中国就是“数千”;而在大量基层的AI人才缺口上,中国至少缺少500万人。
无独有偶,4月19日,在博鳌亚洲论坛2021年年会分论坛上,百度CTO王海峰也分享了一个重要观点:“当前人工智能已经开始影响各行各业,我们不可能要求每个行业都有足够多的精通深度学习底层算法的专家,比如飞桨深度学习平台目前已经有260多万名开发者,这些开发者不需要每个人都从第一行人工智能的算法代码开始写起,而是直接调用这些框架”。
“应用门槛大幅降低,也会推进人工智能更快地应用,更快地推进产业智能化。”王海峰说。
最后,王海峰还提到,随着人工智能用的越来越广,一方面需要降低门槛,让大家用得更方便,另一方面,百度也制定了AI人才的培养计划,将在5年之内培养500万人使用AI,这个数字与官媒的报道大体一致。
显然,中国AI领域面临的人才缺口,不是一时一地可以解决的,但是,解决方法也是多种多样的。
第一是院校培养。
中国科学院大学在我国高校中率先成立人工智能技术学院,随后,2018年,教育部印发了《高等学校人工智能创新行动计划》,上海交大、南京大学、清华大学、哈尔滨工业大学、南京航空航天大学、南京理工大学、南京邮电大学等相继成立人工智能研究院或学院。
第二是师资培训。
4月24日,来自全国百余所高校的近百名教师齐聚百度,以学生的身份参加2021年首期也是总第十四期全国高校深度学习师资培训班,开启为期四天的 AI 学习旅程。
全国高校深度学习师资培训班由教育部和工业和信息化部指导,百度与国内各大高校联合发起,迄今已培训近2000位教师,共计覆盖500余所高校。
第三是人才实训。
如百度建设了AI Studio学习与实训社区,面向教育和学习场景、集开放数据、开源算法、免费算力于一体,为开发者提供高效易用的学习开发环境、丰富的体系化课程、海量开源实践项目、以及高价值的AI竞赛。目前, AI Studio平台上已累计了70万多开发者、80多万的样例工程和数据集、5000多精品课程内容、70余场AI竞赛,并提供海量免费GPU算力资源。
笔者曾经采访过一些参与师资培训的各大院校的人工智能系的负责人,他们大都表示,AI Studio是他们最感兴趣的,因为其上提供的内容和工具,已经完全可以用来作为一个高校开辟人工智能本科、研究生教学的基础平台,而免费的算力更可以用“慷慨”来形容,他们中的很多人已经在用AI Studio构建教学平台。
其实,除了师资培训,百度飞桨学院旗舰项目AICA(首席AI架构师培养计划)、飞桨快车道等还面向产业技术人群,提供专项培训,加快培养既懂AI技术又懂业务场景的复合型AI人才。
B
飞桨如何降低中国人使用AI的门槛
人才不够,加速培养,是典型的正向思维,但有时候在人才缺口这个问题上,我们也需要“逆向思维”。
打一个比方,早期用计算机处理图片的难度是很高的,需要调整无数的参数。所以,人们发明了Photoshop这样的工具,把所有的绘图功能都集成在一个软件里,而且自带大量的模板,从而使得用计算机绘图变成了一个标准化、容易学习的工作。
然而,Photoshop使用仍然有一定专业门槛……所以更多的人愿意使用“美图秀秀”,后者不用你学习任何专业知识,只需要选择滤镜和照片风格,然后自动生成图片就行。
飞桨深度学习平台,其实也有Photoshop模式和美图秀秀模式可供选择。
对高阶开发来说,Photoshop模式还是主流,因为要涉及的方方面面太多,需要有较强的可调整余地。
但是,Photoshop模式显然更针对于专业场景,而在我们的生产和生活中,其实有大量的场景,可以使用通用化的解决方案,这种情况下是否有可能由完全零算法基础的用户简单几步轻松创建AI模型呢?
飞桨从2017年推出的EasyDL零门槛AI开发平台就是基于这样的思路。
EasyDL通过先进的技术把AI开发这件事情变得像使用家电一样简单,你不必了解家电的内部构造和电路原理,也能享受家电带来的便捷。
由此,飞桨上最年轻的开发者只有6、7岁,这是属于AI时代特有的奇迹。
EasyDL虽然目标是“简单”,但为了达到“简单”,实则需要复杂的技术支持,在“零算法基础”的前提下,无经验或仅仅受过短期培训的开发者,可以运用图像分类、物体检测、图像分割、文字识别、音视频分类、语音识别自训练、表格数据预测、文本分类、情感倾向分析等十余种模型类型完成开发。
除了EasyDL,飞桨企业版里还有BML全功能AI开发平台(Baidu Machine Learning,简称BML),它专为各种不同习惯的开发者匹配了多种模型开发方式与开发环境,开发者可以选择尽可能屏蔽不必要的复杂的底层API,也能够依靠自己的代码能力打造AI模型,同时,在部署问题上最大化减轻开发者的压力。
在文章的最后部分,笔者附上一张飞桨的全景图。
其实,您可不要认为所有的深度学习框架都是如此,可以说,除了底层架构外,丰富的模型库、端到端开发套件、工具组件和EasyDL、BML等开发平台,都是飞桨的特色。
总体上说,飞桨起步的确不是最早的,但正因为如此,也少走了一些弯路;而飞桨最大的区别之处,就在于结合中国的国情,结合中国需要大量、快速开发海量AI模型而人才缺口很大的现实痛点,尽可能的在提供工具、降低门槛上下了很多的功夫,而这是另外的深度学习框架与之有一定差距甚至是极大差距的原因,也是飞桨市场份额迅速上升的根本要素。
其实,对于飞桨这个话题,笔者的兴趣由来已久,本想写一篇3000、4000字的科普小文,但没有想到拉拉杂杂已经写了近万字,还没有介绍完。
其实,这的确是一个硬核科普的硬话题,我之所以愿意啃这块硬骨头,是因为我自己也从来没有找到一篇对深度学习平台做到透彻、深入、又通俗易懂的文章,所以我打算自己来写一篇,就有了这篇作品。
但我发现,这篇文章只是最基本的做到了解释何为飞桨,对于飞桨产生过程中最重要的因素——人,却介绍的很少;对于飞桨普及中惠及的人群、产业,也几乎没有提及;对于飞桨对于中国在AI创新中的地位和价值,也浅尝辄止。
因此我有一个大胆的计划,在近期推出一组把以上问题都说透的系列报道,大概包含5-6篇文章,每篇文章说一个方面,大概5000字为限。我感觉到,如果我的文章能够让多一些的人了解飞桨,多一些的行业、应用场景中的需求者、开发者读到这些文章,从而为中国AI产业能起到添砖加瓦的作用的话,那就实现了我创作的初衷,正所谓——书生报国无它物,唯有手中笔如刀。
最新活动更多
-
即日-1.16立即报名>>> 【在线会议】ImSym 开启全流程成像仿真时代
-
即日-1.24立即参与>>> 【限时免费】安森美:Treo 平台带来出色的精密模拟
-
2月28日火热报名中>> 【免费试用】东集技术年终福利——免费试用活动
-
即日-3.21立即报名 >> 【深圳 IEAE】2025 消费新场景创新与实践论坛
-
4日10日立即报名>> OFweek 2025(第十四届)中国机器人产业大会
-
7.30-8.1火热报名中>> 全数会2025(第六届)机器人及智能工厂展
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论