在视频生成场景中,用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。
![](https://image.jiqizhixin.com/uploads/editor/a4b1d340-a525-41ba-8e3b-7c2fb557e77d/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/a5186732-d38e-4d80-bb44-b0bdcad424d5/640.png)
项目网站:https://walt-video-diffusion.github.io/ 论文地址:https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf
![图片](https://image.jiqizhixin.com/uploads/editor/5fa28174-f762-4de0-b7ae-6160d2e4d84c/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/fe91630b-2543-4061-95df-67b2e5aa20c2/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/f4b92083-bdd3-47e2-b2c0-bf84991277cc/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/453c7f44-9143-42b8-9b67-b4f612bd9429/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/f322c3c1-10bf-42a3-a1ce-0ba01bb47082/640.png)
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
在视频生成场景中,用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。
自动编码器是用于无监督学习高效编码的人工神经网络。 自动编码器的目的是学习一组数据的表示(编码),通常用于降维。 最近,自动编码器已经越来越广泛地用于生成模型的训练。
调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details
自注意力(Self-attention),有时也称为内部注意力,它是一种涉及单序列不同位置的注意力机制,并能计算序列的表征。自注意力在多种任务中都有非常成功的应用,例如阅读理解、摘要概括、文字蕴含和语句表征等。自注意力这种在序列内部执行 Attention 的方法可以视为搜索序列内部的隐藏关系,这种内部关系对于翻译以及序列任务的性能非常重要。
一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。