
其实大模型在DeepSeek-V3时期就已经「顿悟」了?
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
大模型江湖,算法与工程孰执生意牛耳?
OpenAI 前CTO Mira Murati 的新团队近期透露了哪些消息?
2025 年,通用机器人要从实验室走向市场了吗?
机器人初创公司 Figure AI 近期提出了一个通用具身智能模型 Helix,是首个能够输出高频率连续控制整个类人上肢的 VLA。Helix 模型实现的突破性效果,引发了近期对于具身机器人领域进展的关注。
Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
在 LLMs 中的「推理」仍然是一个有争议的话题,现有的许多模型可以产生看起来逻辑连贯的回应,但它们的推理方式与人类的逻辑推理截然不同。而近期许多推理模型在 test-time Scaling 中取得突破,通过让模型产生更长的 CoT 来实现更强的推理能力,也引发了许多对该技术的深入研究。CoT 如同推理模型提供了一套套「思维模板」,在后训练的多个环节里扮演着重要角色。
2025 年,消费级 AI 应用再次洗牌?
近日,a16z 发布了 2025 年全球生成式 AI 应用前 100 排行榜(第四期)。
北航&北邮综述从通信角度解析 LLM - MAS 系统功能
北航和北邮的研究者近期发布综述《Beyond Self-Talk: A Communication-Centric Survey of LLM-Based Multi-Agent Systems》,深入探究了基于大语言模型(LLM)的多智能体系统(MAS)中的通信机制。
AAAI《人工智能研究的未来》解析 2025 AI 趋势
人工智能促进协会(AAAI)2025 年总统小组发布了报告《人工智能研究的未来》(Future of AI Research)报告。
Week 12 · 大模型江湖,算法与工程孰执生意牛耳?
本周,英伟达于 GTC 发布 GB300 芯片与系列 AI 产品;xAI 收购视频生成创企 Hotshot。
Week 11 · Long-CoT 后,推理模型的「思维模板」有哪些新玩法?
本周,Meta FAIR 和纽大等提出没有归一化层的 Transformer;前 DeepMind 科学家创业成立 Reflection AI。
Week 10 · 从虚拟到现实,Sim2Real Might Actually Work
本周,Ilya Sutskever 创企 SSI 完成 20 亿美元融资,核心成员公开;通用 AI 智能体 Manus 引热议
Week 09 · AI已精,硬件何愚?
本周,OpenAI 发布 GPT-4.5 研究预览版;DeepSeek连续五天开源多项工具即分析数据。
Week 08 · 「知识蒸馏」+SFT,可得「推理」否?
本周,DeepSeek 与月之暗面团队分别发布 Attention 主题论文;Figure 在与 OpenAI 取消合作后发布具身智能模型 Helix。
Week 07 · 从 PPO 到 GRPO,DeepSeek-R1 做对了什么?
本周,欧盟启动 200 亿欧元 InvestAI 计划;Sam Altman 透露 OpenAI 未来产品规划。
其实大模型在DeepSeek-V3时期就已经「顿悟」了?
虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人任务中,性能可以提高最多 50 倍。
在虚拟现实、游戏以及 3D 内容创作领域,从单张图像重建高保真且可动画的全身 3D 人体一直是一个极具挑战性的问题:人体多样性、姿势复杂性、数据稀缺性等等。
自然界生物通过数百万年的进化,获得了适应环境的完美身体结构与环境交互能力。
抓住「通用计算创新、大模型创新、AI 应用创新」三大浪潮。
大模型时代,业界和学术界都涌现出了许多创新成果。
偶然发现了一个很有趣的 AI 基准测试,点开链接,竟然是一个 MineCraft 作品投票页面?
IEEE国际计算机视觉与模式识别会议( Conference on Computer Vision and Pattern Recognition)CVPR 2025公布论文录用结果,社交平台Soul App技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》(《基于自回归动作生成的实时流式音频驱动人像动画系统》)被接收。
实在 Agent:让每个企业拥有 “数字大脑”,AI 执行进入全自主时代。
天猫推出AI设计工具 商家可一键生成媲美实拍场景图。
在这里,埃默里大学(Emory University)的研究人员探索了现有方法在预测数千种此类蛋白质的分子功能方面的潜力和局限性。
近期,来自埃默里大学、南加州大学等机构的联合研究团队基于 DeepSeek 强化学习提出了一套医疗 VLM 策略,称之为 “Med-R1”,通过鼓励模型在 “推理过程” 上不断探索,大大提升了跨模态、跨任务的泛化能力。
最热文章