
古人在线骂人成流量密码
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
在 LLMs 中的「推理」仍然是一个有争议的话题,现有的许多模型可以产生看起来逻辑连贯的回应,但它们的推理方式与人类的逻辑推理截然不同。而近期许多推理模型在 test-time Scaling 中取得突破,通过让模型产生更长的 CoT 来实现更强的推理能力,也引发了许多对该技术的深入研究。CoT 如同推理模型提供了一套套「思维模板」,在后训练的多个环节里扮演着重要角色。
2025 年,消费级 AI 应用再次洗牌?
近日,a16z 发布了 2025 年全球生成式 AI 应用前 100 排行榜(第四期)。
北航&北邮综述从通信角度解析 LLM - MAS 系统功能
北航和北邮的研究者近期发布综述《Beyond Self-Talk: A Communication-Centric Survey of LLM-Based Multi-Agent Systems》,深入探究了基于大语言模型(LLM)的多智能体系统(MAS)中的通信机制。
AAAI《人工智能研究的未来》解析 2025 AI 趋势
人工智能促进协会(AAAI)2025 年总统小组发布了报告《人工智能研究的未来》(Future of AI Research)报告。
从虚拟到现实,Sim2Real Might Actually Work
Sim2Real 不再是 Sim2Null?
从 LLM 到 Agent:Manus 们莫不是「推理模型 + RPA」 ?
近期,通用 AI Agent 产品「Manus」在 AI 圈内引发了极多的关注。
Week 11 · Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
本周,Meta FAIR 和纽大等提出没有归一化层的 Transformer;前 DeepMind 科学家创业成立 Reflection AI。
Week 10 · 从虚拟到现实,Sim2Real Might Actually Work
本周,Ilya Sutskever 创企 SSI 完成 20 亿美元融资,核心成员公开;通用 AI 智能体 Manus 引热议
Week 09 · AI已精,硬件何愚?
本周,OpenAI 发布 GPT-4.5 研究预览版;DeepSeek连续五天开源多项工具即分析数据。
Week 08 · 「知识蒸馏」+SFT,可得「推理」否?
本周,DeepSeek 与月之暗面团队分别发布 Attention 主题论文;Figure 在与 OpenAI 取消合作后发布具身智能模型 Helix。
Week 07 · 从 PPO 到 GRPO,DeepSeek-R1 做对了什么?
本周,欧盟启动 200 亿欧元 InvestAI 计划;Sam Altman 透露 OpenAI 未来产品规划。
Week 06 · DeepSeek 影响持续升温;李飞飞等用$50训出推理模型......
近两周,DeepSeek 模型引发美国市场连锁反应;李飞飞、Percy Liang等用不到50 美元的成本训练了 s1 推理模型。
古人在线骂人成流量密码
3月18日,“2024年度服务商评选”正式揭晓,九章云极DataCanvas公司核心产品DataCanvas Alaya NeW智算操作系统凭借卓越的技术创新力与行业标杆价值,成功入选“2024年度产品”。
DeepSeek-R1 问世后,我们一直在期待能「强推理、慢思考」的大模型进化成多模态模式。
多模态,性能超 GPT-4o Mini、Gemma 3,还能在单个 RTX 4090 上运行,这个小模型值得一试。
今年年初,OpenAI 上线 Deep Research,开启了智能体又一新阶段,其能根据用户需求自主进行网络信息检索、整合多源信息、深度分析数据,并最终为用户提供全面深入的解答。
近年来,深度学习技术在自动驾驶、计算机视觉、自然语言处理和强化学习等领域取得了突破性进展。
DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率,不过其论文中似乎还缺少一些关键细节,让人难以复现出大规模和工业级的强化学习系统。
在春节的 DeepSeek 大热后,大模型也更多走进了大家的生活。
「就像 iPhone 4 重新定义了手机,MindVLA 也将重新定义自动驾驶。」
来自 IBM TJ 沃森研究中心和 MIT-IBM 沃森人工智能实验室的研究人员提出了一种受神经启发的 LLM 推理网络 ——SOLOMON,旨在增强领域特定的适应性。
华盛顿大学 David Baker 团队证明,结合使用微调 RFdiffusion 网络的计算蛋白质设计与酵母展示筛选,可以生成抗体可变重链(VHH)和单链可变片段(scFv),以原子级精度结合用户指定的表位。
探索人工智能(AI)规模化应用的新路径。
最热文章