百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 资源推荐 > 正文

ASAPP与MIT联合发文:我们该如何训练RNN才能使其像CNN那样快?

jasimen 2025-05-06 19:29 9 浏览

图:pixabay

原文来源:arxiv

作者:Tao Lei Yu Zhang

「机器人圈」编译:嗯~阿童木呀、多啦A亮

相信大家都知道,由于在并行化其状态计算时所存在的固有困难,循环神经网络的规模状态相对来说比较差。例如,直到ht-1的整个计算完成之后,ht的前向计算才开始执行,这就是并行计算村子的主要瓶颈问题。在这项工作中,我们提出了一种可替代的RNN实现方法,即故意简化状态计算并展现更多的并行性。而我们在此处所提出的循环单元的运行速度与卷积层一样快,甚至要比经cuDNN优化的LSTM快5至10倍。我们展示了该单元在广泛应用中所展现的有效性,包括分类,问答,语言建模,翻译以及语音识别。而我们将开源用PyTorch和CNTK1实现的代码资源。

现如今,在深度学习中所取得的一系列最新进展大都得益于日益增加的模型容量和相关的计算。这通常涉及使用更大更深的网络,而这往往是通过广泛的超参数设置进行调整得到的。但是,不断增长的模型大小和超参数,大大增加了训练时间。例如,训练一个最先进的翻译或语音识别系统往往需要几天的时间才能完成(Vaswani等人于2017提出,Wu等人于2016提出,Sak等人于2014提出)。很显然的一点是,计算已经成为深度学习研究领域的主要瓶颈问题。

为了应对显著增加的计算需求,诸如GPU加速训练这样的并行化已被广泛应用于扩展深度学习领域中(Diamos等人于2016提出; Goyal等人于2017提出)。虽然诸如卷积和注意这样的操作非常适合于多线程/ GPU计算,但是循环神经网络仍然不太适合并行化。在一个典型的实现中,输出状态ht的计算将会保持暂停,直到ht-1的整个计算完成。这个约束阻碍了独立的计算,并且大大地减缓了序列处理的进程。图1展示了经cuDNN优化的LSTM(Appleyard等,2016)和使用conv2d的词级卷积的处理时间。它们之间的区别是非常明显的——即使是经过特别优化的LSTM的实现速度也要慢10倍以上。

图1:使用cuDNN LSTM、单次级别卷积conv2d和建议的RNN实现的一批32个样本的平均处理时间(以毫秒为单位)。l:每个序列的token数,d:特征维度和k:特征宽度。报道的数字是基于具有Nvidia GeForce GTX 1070 GPU和Intel Core i7-7700K处理器的PyTorch。

在这项工作中,我们介绍了简单循环单元(SRU),其运行明显快于现有的循环实现。循环单元简化了状态计算,从而暴露出与CNN、注意力和前馈网络相同的并行性。具体来说,虽然内部状态ct的更新仍然使用先前的状态ct-1,但是在循环步骤中对ht-1的依赖性已经下降。因此,可以在不同的维度和步骤中容易地并行化循环单元中的所有矩阵乘法(即gemm)和元素操作。类似于cuDNN LSTM和conv2d的实现,我们通过将所有元素操作编译成单个内核函数调用来执行对SRU的CUDA级优化。如图1所示,我们的实现达到了与其conv2d配对物相同的速度。

当然,不能提供可比较或更好的准确性的替代实现将不具有适用性。为此,我们评估SRU广泛的应用范围包括分类、问答、语言建模、翻译和语音识别。实验结果证实了SRU的有效性——与这些任务的循环(或卷积)基线模型相比,它实现了更好的性能,同时能够更快地进行训练。

这项工作提供了简单的循环单元(SRU),其运行速度与CNN一样快速的模块,可轻松扩展到10层以上。 我们对NLP和语音识别任务进行了广泛的评估,证明了这个循环单元的有效性。我们开源实现方法,以促进未来NLP和深度学习的研究。

论文全文链接:
https://arxiv.org/pdf/1709.02755.pdf

PyTorch代码实现:
https://github.com/taolei87/sru

相关推荐

最美宋词·忆秦娥:一啼箫声秦娥咽,再啼箫声秦娥血!

「愿品诗文三分骨|望赠好友十里香」专注古典诗词|鼓励原创文学歡迎訂閱|若喜歡本文|請與好友共饗忆秦娥,词牌名双调,仄韵格,四十六字。相传李白首制此词,最早出李白《忆秦娥·箫声咽》词。对...

谈《忆秦娥 箫声咽》

谈《忆秦娥箫声咽》忆秦娥箫声咽李白箫声咽,秦娥梦断秦楼月。秦楼月,年年柳色,霸陵伤别。乐游原上清秋节,咸阳古道音尘绝。音尘绝,西风残照,汉家陵阙。在诗坛上有诗家三李之说,既大小李和...

一天一首古诗词9:李白《忆秦娥o箫声咽》

#历史开讲#忆秦娥·箫声咽唐·李白箫声咽,秦娥梦断秦楼月。秦楼月,年年柳色,灞陵伤别。乐游原上清秋节,咸阳古道音尘绝。音尘绝,西风残照,汉家陵阙。如何记忆?题目:忆秦娥又名“秦楼月,都出自本词“秦娥梦...

古诗词赏析:李白《忆秦娥·箫声咽》,百代词曲之祖

世事纷扰,诗书静心忆秦娥·箫声咽唐·李白箫声咽,秦娥梦断秦楼月。秦楼月,年年柳色,灞陵伤别。乐游原上清秋节,咸阳古道音尘绝。音尘绝,西风残照,汉家陵阙。提起唐诗,人们就会想到李白,他是唐诗的顶峰,“诗...

分享一首李白的词《忆秦娥·箫声咽》

#头条创作挑战赛#抄书打卡第一百五十八天昨天,抄书打卡断更了一天。一方面是自己身体的原因,还有一个原因是前天我阅读了季羡林的散文《一条老狗》后,想做一个朗诵视频。在制作这个视频的时候,才感觉这个视频制...

箫诗品鉴:忆秦娥·箫声咽

古今写箫的诗词不计其数,历代文人对箫有一种独特的情怀,或直抒胸臆或借物比兴,来表达或喜或悲或抑或扬的心情。箫艺在箫外,在学习箫的演奏技巧同时,还应了解箫所蕴含的优秀历史积淀。让我们一同走进箫诗的世界。...

亲人去世后,为什么会有蝴蝶出现?

专注分享精彩内容,感谢各位朋友阅览,希望能获得您的点赞、关注和留言!祝各位读者朋友都能够心想事成,万事如意!今天刷到一天新闻,小女孩的父亲去世后四七当天,一只蝴蝶落入正在熟睡女儿手掌心之中久久不愿离去...

人死后是否成为仙或上天堂,取决于多种因素,包括生前的善恶…

人死后能否成仙或上天堂,因文化和信仰而异。多数宗教认为取决于生前善恶、修行或信仰虔诚度,如道教强调修炼行善,基督教注重信德与救赎。不同体系对彼岸的解释各异,但普遍导向劝人向善的核心价值观。人死后能否成...

古代为什么说冷宫是太监和下人的天堂?

紫禁城的冷宫向来被视为失败者的流放地,但这座阴森院落却为另一群人提供了特殊的生存空间。在森严的宫禁制度下,冷宫意外成为底层宫人难得的喘息之所。得势妃嫔宫中的规矩如同密织的蛛网。宫女需寅时三刻起...

只有结过婚才懂不结婚才是人间天堂,网友:和错的人结婚才是地狱

阅读此文之前,请点击一下“关注”,既方便您进行讨论和分享,又能每天给您带来不一样的故事,感谢您的支持,这厢有礼了~我28岁那年,家里催得紧,隔壁王婶给介绍了个对象。那男的第一次来我家,拎着两箱特仑苏,...

一个注定回不了家的孩子!门内是天堂,门后是地狱

原生家庭对孩子的成长有什么样的影响?这个问题在很多时候都会被大家提起。无论孩子以后是功成名就,还是一事无成,甚至是变得对社会有害,大家几乎都会感叹一句原生家庭。前几天刷到了一个视频,让人感触颇深:寒风...

拾金不昧!公园巡逻捡到黄金 保安报警联系失主

“幸亏遇到拾金不昧的保安大姐,丢掉的黄金当天就找回来了。”张先生4日庆幸地说。原来,3日上午,张先生坐在君临闽江马路对面的闽江北港公园一处亭子内休息,起身时没注意,口袋里的两条黄金掉出来了。“这两条黄...

小说:他自问稳操胜券,却没想到一切都是别人的将计就计

小姑娘的家,在村子的最外围,这点倒是颇令雨昊满意,他之所以选择这个小姑娘,一是看她穿的破烂,二是必要时,可以用小姑娘来保护自己,毕竟在正玄大陆,不少人还心存正义之感远的不说,柳凡就是一个很好的例子,起...

钱钟书《围城》:爱情,总是有缘无份,婚姻,需要长期经营

“婚姻是一座围城,城外的人想进去,城里的人想出来。”钱钟书先生在《围城》里写下的这句名言,道破了无数人对婚姻的复杂感受。而书中主角方鸿渐的爱情与婚姻经历,也仿佛一面镜子,映照出我们在情感之路上的种种境...

钱钟书的《围城》写了啥?网友:浓缩成10句话,又毒舌又犀利

一句话让你来形容一下当下的婚姻,你觉得是什么?我会引用钱钟书围城里的一句话:“婚姻像围城,城外的人想冲进去,城里的人想逃出来。”《围城》不光是说婚姻,也说了人生中的那些“潜规则”:年轻的方鸿渐在该努力...