麻省理工学院发现更小更容易训练的神经网络,或有望推动技术改革
神经网络技术起源于上世纪五、六十年代,当时叫感知机,拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果。
尽管人工智能取得了很大的进步,但现在大多数基于人工智能的产品仍然依赖于“深度神经网络”。这种网络通常非常大,而且训练成本高得令人望而却步。
麻省理工学院的研究人员希望改变这一现状。在今天发表的一篇论文中,研究人员揭示了神经网络中包含的“子网络”,比之前的网络小10倍,而且可以更便宜、更快地进行训练。
为了训练大多数神经网络,工程师给它们提供大量的数据集,但这可能需要几天的时间和昂贵的GPUs。
来自麻省理工学院计算机科学和人工智能实验室(CSAIL)的研究人员发现,在这些训练有素的网络中,有更小的子网络,可以做出同样准确的预测。
CSAIL所谓的“彩票假说”就是基于这样一种观点,即训练大多数神经网络就像买所有的彩票,以确保中奖。相比之下,训练子网就像只买有奖的那张彩票一样。
问题在于,研究人员还没有想出如何在不构建完整神经网络的情况下找到这些子网,然后修剪掉不必要的位。研究人员目前还没有找到这些子网络的方法。
如果他们能找到一种方法跳过这一步,直接进入子网络,那么这一过程可以节省数小时的工作。并使训练神经网络不仅仅对大公司开发而且对单个程序员开放。
但是,如何有效地找到子网络,并明确为什么有些子网在训练上比其他子网表现地更好,可能会让研究人员忙上几年。
最新活动更多
-
11月28日立即报名>>> 2024工程师系列—工业电子技术在线会议
-
12月19日立即报名>> 【线下会议】OFweek 2024(第九届)物联网产业大会
-
即日-12.26火热报名中>> OFweek2024中国智造CIO在线峰会
-
即日-2025.8.1立即下载>> 《2024智能制造产业高端化、智能化、绿色化发展蓝皮书》
-
精彩回顾立即查看>> 2024 智能家居出海论坛
-
精彩回顾立即查看>> 【在线会议】多物理场仿真助跑新能源汽车
推荐专题
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论