正如论文一作所说,「新架构 Titans 既比 Transformer 和现代线性 RNN 更有效,也比 GPT-4 等超大型模型性能更强。」
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
No More Next-Token Prediction?
01.10Meta 的研究者在 2024 年 12 月发布了多项工作中探索了模型的潜在空间(Latent Space),试图通过改变潜空间的排列方式,彻底改变模型的思维表征,进而实现更符合人类思维方式的推理。对潜在空间探索的背景部分原由在于,当前所有开源、闭源的 LLM 均缺乏在抽象层面、独立于特定语言或模态的信息处理和生成的显式分层结构。
Altman:不装了!一半是赚钱,一半是「神奇药水」
01.10Sam Altman 在其博客文章中明确表示,「已经知道如何构建通用人工智能(AGI)」。
Agent 成为 25 年产品落地最佳方式?谷歌发布最全 Agent 白皮书
01.102025 年初,谷歌团队发布了 Agent 主题的白皮书,全面地介绍了关于 Agent 的基本概念、与 LLM 的区别、核心架构、工作原理及在实际中的应用等。
AI4S 新形态?AI Scientists 能做到什么程度的科研?
01.042024 年涌现了哪些 AI Scientists?LLM在科研思路上有何优势?AI Scientist 端到端科研流程表现如何?AI Scientist写的论文有何优缺点?
Agents Are Not Enough? !
01.04AI Agent 在 2024 年里被赋予了极大期待。然而,纵观 AI Agent 在 2024 年度的突破和应用,其距离真正实现能力强大且广泛应用的未来仍相差甚远。在技术缺陷、社会适应性问题和产业链尚不成熟几大阻碍 Agent 产品广泛应用的主要问题中,技术缺陷或是最有机会先被解决的问题?
人形机器人的「钱景」在哪,黄仁勋想清楚了吗?
01.03英伟达在人形机器人赛道上的布局有多少胜算?
Week 02 · No More Next-Token Prediction?
01.10本周,英伟达发布 Cosmos 世界模型平台及技术报告;前 Sora 负责人宣布将领导谷歌 DeepMind 世界模型团队。
Week 01 · Agents Are Not Enough? !
01.04本周,OpenAI 宣布组织架构调整;智谱 AI 发布推理模型 GLM-Zero-Preview。
Week 52 · 让大模型理解「内外远近」更重要?「空间推理」成大厂竞逐焦点
12.27本周,深度求索开源 DeepSeek-V3 模型引热议;传 OpenAI 计划重新研发人形机器人。
Week 51 · 舍弃 Tokenizer 才是做多模态的正解?
12.20本周,CMU 等多家机构联合推出生成式物理引擎 Genesis;谷歌发布 Gemini 2.0 Flash Thinking 版模型。
Week 50 · 预训练将结束?AI的下一步发展有何论调?Scaling Law 撞墙与否还重要吗?
12.13本周,谷歌发布量子芯片Willow;Yann LeCun 团队提出导航世界模型 NVM。
Week 49 · 在推理阶段给大模型「打补丁」之外,实现更强 AI 还有哪些不一样的思路?
12.06本周,OpenAI 发布推理模型 o1 的完全体版本;谷歌DeepMind 发布 Genie 2 世界模型。
正如论文一作所说,「新架构 Titans 既比 Transformer 和现代线性 RNN 更有效,也比 GPT-4 等超大型模型性能更强。」
上海交通大学近日发布了 O1 复现项目系列研究的第三部分成果。
这是全球首个支持全天候灾害响应的多模态超高分辨率数据集,论文和数据集已公开,作者团队来自东京大学(UTokyo),理化学研究所(RIKEN),苏黎世联邦理工学院(ETH Zurich)和微软亚洲研究院(MSRA)。
做大做强。
自适应 LLM 反映了神经科学和计算生物学中一个公认的原理,即大脑根据当前任务激活特定区域,并动态重组其功能网络以响应不断变化的任务需求。
来自北京大学、北京邮电大学、清华大学、香港大学、香港城市大学、新加坡管理大学、新加坡国立大学、浙江大学(按拼音首字母排序)的15名在校生获奖,每人获得奖学金10万元人民币。
2025 年,我们可能会看到第一批 AI Agent 加入劳动力大军,并对公司的生产力产生实质性的影响。
让我们说中文!
近期,OpenAI CEO Sam Altman 宣布,2025 年将推出名为 “Operator” 的虚拟员工计划,AI 代理将能够自主执行任务,如写代码、预订旅行等,成为企业中的 “数字同事”。
随着语言大模型的成功,视觉 - 语言多模态大模型 (Vision-Language Multimodal Models, 简写为 VLMs) 发展迅速,但在长上下文场景下表现却不尽如人意,这一问题严重制约了多模态模型在实际应用中的潜力。
夸克发布全新品牌Slogan“2亿人的AI全能助手”。
现在 AI 智能体可以 24*7 小时为你打工。
最热文章