行业内参

AI Daily

AI Daily 快讯 · 2019/11/12

单CPU处理1s视频仅需37ms、GPU仅需10ms，谷歌提出TVN视频架构

视频理解是计算机视觉领域中的重要问题，它有很多应用，如视频自动标注、行为识别和机器人感知。视频理解对自动智能体在现实世界中的应用有重大影响，目前它仍是一道难题。现有的解决方案计算成本高昂，最快速的算法需要在强大的 GPU 上运行才能处理超过 0.5 秒的视频片段。为了解决该问题，谷歌机器人团队提出使用进化算法，自动设计出以原来计算成本的一部分提供相当性能的网络（即低计算成本、高性能）。具体来说，谷歌研究者提出了一种为视频理解任务设计「微」神经网络（tiny neural network）族的通用方法。这些微神经网络可实现相当高的准确率，且运行高效，可实时或者以更快的速度运行。它们在一块 CPU 上处理约 1 秒的视频片段需要 37-100 ms，在一块 GPU 上仅需 10 ms，速度是当前模型的 100 倍。研究者将这些网络称为 Tiny Video Networks (TVN)，因为此类网络仅需要极小的运行时，这在视频模型中尚属首例。

PM 5:48arxiv.org

登录后评论

暂无评论~

登录

文章库

文章库 PRO通讯会员 SOTA！模型 AI Shortlist

AI 好好用

登录