Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

iconicon最新通讯
iconicon最新参考

Week 25 · 英伟达的新工作 Nemotron-4 340B 火了!合成数据能否将大模型带到下一个阶段?

icon06.21

本周,Anthropic 发布大模型 Claude 3.5 Sonnet;银河通用机器人宣布完成 7 亿元天使轮融资。

Week 24 · MatMul-free 有机会一搏「硬件彩票」吗?

icon06.14

本周,苹果发布 Apple Intelligence 智能系统及一系列进展;微软宣布于下月停止 Copilot GPTs 服务。

Week 23 · SSM 能取代 Transformer 搞出更「牛」的大模型吗?

icon06.07

本周,英伟达和 AMD 分别公布最新芯片进展;Mamba-2论文证明 SSM 和注意力机制可以互补。

Week 22 · 搞定视频任务泛化,VLM 还有机会吗?

icon05.31

本周,Bengio 团队提出基于注意力的 Aaren 模型;OpenAI 重启此前已解散的机器人团队。

Week 21 · 离散化、对齐文本还是预训练,哪个才是 LLM 处理时序数据的关键?

icon05.24

本周,字节、阿里、百度、腾讯等国内大模型厂商宣布模型 API 调用价格下降;微软推出「Copilot+PC」。

Week 20 · GPT-4o 与 Gemini 能否用多模态撬开下一代 AI 的新进程?

icon05.17

本周,OpenAI 与谷歌商战引业界热议;OpenAI 首席科学家离职;Anthropic 宣布首席产品官人选。

英伟达的新工作 Nemotron-4 340B 火了!合成数据能否将大模型带到下一个阶段?

icon06.21

英伟达开源的 Nemotron-4 340B 系列模型,可快速生成医疗、金融、制造、营销等不同领域的数据,用于预训练和微调特定的模型。

大模型赚钱「攻略」盘出来了!ToC 热火朝天,ToB 暗藏玄机

icon06.21

似乎大模型公司赚钱的路子和面临的挑战更清晰了一些。

深度揭秘,宇树科技是如何用 9.9 万人形机器人撬动市场的?

icon06.21

一档名为「Soft Robotics Podcast」的播客栏目邀请到了人形机器人 Unitree G1 的研发团队成员,探讨了 Unitree G1 的技术细节、市场策略以及未来愿景等。

MatMul-free 有机会一搏「硬件彩票」吗?

icon06.14

UCSC、苏州大学和 UC Davis 等机构的研究者近期发布论文,开发了一种无需矩阵乘法的大型语言模型 MatMul-free,可在 FPGA 上以接近人脑的功耗运行,内存消耗可降低 10 倍以上。

「大力未必出奇迹」:深入构建 AI 算力集群背后的逻辑

icon06.14

据 OpenAI 前研究员、前超级对齐部门成员 Leopold Aschenbrenner 近期发布的一份报告中提到,「到 2028 年,我们正走在耗资 1000 亿美元的单个训练集群的道路上。」

Aidan Gomez 揭秘大模型创业的盈利秘诀

icon06.14

人工智能初创公司 Cohere 的席执行官兼创始人 Aidan Gomez 近期接受了外媒的访谈,并讨论了 Cohere 与其他初创公司的差异以及这种差异如何使 Cohere 比其他竞争对手更容易实现盈利。

iconicon