
DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。
Auto Byte
专注未来出行及智能汽车科技
微信扫一扫获取更多资讯
Science AI
关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展
微信扫一扫获取更多资讯
从 PPO 到 GRPO,DeepSeek-R1 做对了什么?
R1 和 Kimi 1.5 都在用的 Rule-based Reward 有何神奇之处?
什么样的硬件产品才配得上 「AI Native」?
严格意义上的「AI Native」硬件产品还未出现。
ARK 2025 年度展望:AI 技术将革新全球经济格局
ARK 投资管理公司发布了《BIG IDEAS 2025》,报告深入分析了人工智能、机器人技术、能源存储、公共区块链和多组学测序等五大技术平台发展趋势,同时预测了其对经济的影响。
与其颠覆Transformer,不如专注改良 Attention?
深度学习领域围绕着如何改进 Transformer 架构的讨论从未停歇。此前,许多研究者试图寻找能够完全替代 Transformer 的新架构,以解决其在计算效率和内存占用方面的局限性。然而,随着研究的深入,继续使用Transformer但改进注意力机制(Attention Mechanism)的做法又开始升温。
大厂、AR 厂商们扎堆 AI 眼镜产品,仅为了数据积累能活到下一轮吗?
近期,AI 眼镜产品在 CES2025 上爆火,百度、阿里等国内大厂也在陆续涌进 AI 眼镜赛道。
合成数据,能与不能?
合成数据的优势涵盖可以大规模生成,可定制,可避开敏感信息,适应多模态学习和可帮助 AI Alignment 等。在2024年里,合成数据似乎开始兑现潜力,绕开模型崩溃的障碍,有望真正开始解决数据稀缺的问题。
Week 07 · 从 PPO 到 GRPO,DeepSeek-R1 做对了什么?
本周,欧盟启动 200 亿欧元 InvestAI 计划;Sam Altman 透露 OpenAI 未来产品规划。
Week 06 · DeepSeek 影响持续升温;李飞飞等用$50训出推理模型......
近两周,DeepSeek 模型引发美国市场连锁反应;李飞飞、Percy Liang等用不到50 美元的成本训练了 s1 推理模型。
Week 04 · 与其颠覆Transformer,不如专注改良 Attention?
本周,月之暗面发布多模态思考模型 Kimi k1.5;OpenAI 正式推出智能体 Operator。
Week 03 · 合成数据,能与不能?
本周,谷歌团队提出适应长期记忆任务的 Titan 架构;UC 伯克利开源成本仅 450 美元的 32B 推理模型 Sky-T1。
Week 02 · No More Next-Token Prediction?
本周,英伟达发布 Cosmos 世界模型平台及技术报告;前 Sora 负责人宣布将领导谷歌 DeepMind 世界模型团队。
Week 01 · Agents Are Not Enough? !
本周,OpenAI 宣布组织架构调整;智谱 AI 发布推理模型 GLM-Zero-Preview。
DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。
昨天,AI 圈可以说非常热闹。
“凡我无法创造的,我就无法真正理解。” -- 费曼
过去一年,3D 生成技术迎来爆发式增长。
今天凌晨,一个创业消息引爆了整个 AI 社区:一家名为 Thinking Machines Lab 的新创业公司建立了,而其背后有一个堪称有史以来最豪华的大模型创业团队阵容。
这波「左右互搏」有看头了。
DeepSeek 新论文来了!相关消息刚刚发布到 𝕏 就吸引了大量用户点赞、转发、评论三连。
德国康斯坦茨大学与巴西米纳斯吉拉斯联邦大学的研究团队提出了一种创新解决方案:利用预训练人工智能模型(Segment Anything Model, SAM)实现纳米颗粒的自动化分割与形态分析。
香港理工大学、上海交通大学、上海人工智能实验的研究者提出了基于文本的开放分子生成基准测试(TOMG-Bench),旨在评估 LLM 在分子领域的开放域生成能力。
带点特斯拉、SpaceX 基因,工程能力很强。
本轮超亿元融资的完成,标志着灵宝CASBOT驶入"技术-资本-场景-量产"并轨发展的快车道。
2 月 18 日,昆仑万维开源中国首个面向 AI 短剧创作的视频生成模型 SkyReels-V1、中国首个 SOTA 级别基于视频基座模型的表情动作可控算法 SkyReels-A1。
最热文章