NeurIPS 2019 抢先看 | 大型随机递归神经网络的高保真视频预测
Quoc V. Le 在内的来自密歇根大学,谷歌研究所,谷歌以及 Adobe 研究所的研究团队发表了一篇名为「大型随机递归神经网络的高保真视频预测」的研究,该论文目前已被 NeurIPS 2019 收录。以下是该研究完整摘要分享:预测未来的视频帧极具挑战性,因为许多变化因素构成了帧如何随时间变化的动态变化。先前提出的解决方案需要在网络架构内部进行复杂的归纳偏置,并进行高度专业化的计算,包括分段掩码,光流以及前景和背景分离。在这项工作中,研究人员质疑了是否需要这样的手工架构,并提出了另一种方法:在使网络容量最大化的同时,为视频预测找到最小的感应偏差。该团队通过进行首次大规模的实证研究来研究这个问题,并通过在三个不同的数据集上学习大型模型来展示最新性能:一个用于建模对象交互,一个用于建模人体运动以及一个用于建模汽车驾驶。点解链接阅读完整论文。