iVideoGPT,满足世界模型高交互性需求。
![图片](https://image.jiqizhixin.com/uploads/editor/059669aa-042e-4c06-8c0d-8bddaddc0361/640.png)
论文地址:https://arxiv.org/pdf/2405.15223 论文标题:iVideoGPT: Interactive VideoGPTs are Scalable World Models
![图片](https://image.jiqizhixin.com/uploads/editor/51db5c7f-d847-4769-9772-c18864c3654a/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/b1ac46a8-daca-4289-9d74-6313895d83f4/640.png)
首先,它显著减少了 token 化后视频的序列长度,该长度随帧数的增加而线性增长,但增长率 n 要小得多; 其次,通过条件编码,预测后续 token 的 transformer 可以更容易地保持上下文的时间一致性,并专注于建模必要的动态信息。
![图片](https://image.jiqizhixin.com/uploads/editor/1ed77a62-3ca7-421b-8b8d-ad15f9a243b7/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/4e5f890f-0677-4b0b-aade-b3d5a1439f48/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/cf9e9840-18b9-4ee7-9425-6ea3d83b8888/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/f9e03193-95d5-40e6-9361-bd6923f3734d/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/5408d1c5-5eb3-4f4e-aab4-6d2bc8372689/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/8db6f1c4-bbba-451e-a455-2a0a6ffcc7c8/640.png)
![图片](https://image.jiqizhixin.com/uploads/editor/df37cb66-1e33-48a1-aecf-ff9c4054b3b8/640.png)
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
iVideoGPT,满足世界模型高交互性需求。
清华大学(Tsinghua University),简称“清华”,由中华人民共和国教育部直属,中央直管副部级建制,位列“211工程”、“985工程”、“世界一流大学和一流学科”,入选“基础学科拔尖学生培养试验计划”、“高等学校创新能力提升计划”、“高等学校学科创新引智计划”,为九校联盟、中国大学校长联谊会、东亚研究型大学协会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员,被誉为“红色工程师的摇篮”。 清华大学的前身清华学堂始建于1911年,因水木清华而得名,是清政府设立的留美预备学校,其建校的资金源于1908年美国退还的部分庚子赔款。1912年更名为清华学校。1928年更名为国立清华大学。1937年抗日战争全面爆发后南迁长沙,与北京大学、南开大学组建国立长沙临时大学,1938年迁至昆明改名为国立西南联合大学。1946年迁回清华园。1949年中华人民共和国成立,清华大学进入了新的发展阶段。1952年全国高等学校院系调整后成为多科性工业大学。1978年以来逐步恢复和发展为综合性的研究型大学。
http://www.tsinghua.edu.cn/知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。