Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

奥特曼筹数十亿美元建全球晶圆厂网络,自造AI芯片

可以低成本代替英伟达?


据彭博社消息,OpenAI CEO 萨姆・奥特曼(Sam Altman)近日再次为一家人工智能芯片企业筹集了数十亿美元的资金,希望建立一个范围覆盖全球的晶圆厂「企业网络(network of factories)」,并计划与未具名的顶级芯片制造商合作。

图片

报道称,奥特曼已与几家大型潜在投资者进行了谈判,希望能筹集到晶圆厂所需的巨额资金。

在生成式 AI 快速爆发的时代,运行 AI 模型面临的主要困难是算力限制。在 ChatGPT 、 DALL-E 等生成式 AI 模型的背后,研究者们投入了大量的算力资源和时间。随着各大公司、研究机构对 AI 芯片需求的持续上升,芯片巨头英伟达的价值更是水涨船高,去年市值首次突破 1 万亿美元,部分原因是它在芯片行业的垄断地位 —— 众所周知,GPT-4、Gemini、Llama 2 和其他模型严重依赖 H100 GPU。

日趋旺盛的高性能 AI 芯片需求正在催生出一些新的芯片创业公司。然而在更上游的位置,高端芯片的晶圆厂数量也是有限的,这促使微软、Meta 这样的公司需要提前数年预定产能,才能获得足够的新型芯片。而要与科技巨头公司竞争,就需要大量资金来承担费用,这是 OpenAI 所不具备的。

据报道,软银集团和总部位于阿布扎比的人工智能控股公司 G42 已经在讨论为奥特曼的项目筹集资金的事宜。但谈判仍处于早期阶段,参与合作伙伴和资助者的完整名单尚未确定。

其他开发 AI 模型的公司也开始尝试制造自己的芯片。OpenAI 的主要投资者微软就是其中一个,该公司于去年 11 月宣布开始制造定制芯片 —— 而且它们都与人工智能有关。

由于对英伟达 H100 GPU 的需求激增,微软的自研替代品 Azure Maia AI 芯片和 Arm 架构的 Azure Cobalt CPU 将于今年上市,该 GPU 将广泛用于生成图像工具和大型语言模型。当前,H100 GPU 持续处于供不应求的状态,以至于有些 GPU 在 eBay 上的售价甚至超过了 4 万美元。

图片

微软为其云基础设施设计的两个定制硅芯片。

紧随其后,亚马逊发布了新版本的 Trainium 芯片,该芯片旨在构建和运行人工智能应用程序。

此外,还有谷歌的芯片设计团队正在使用运行在谷歌云服务器上的 DeepMind AI 来设计其张量处理单元(TPU)等人工智能处理器。

与此同时,AWS、Azure 和谷歌也使用英伟达的 H100 处理器。本周,Meta 首席执行官马克・扎克伯格告诉 The Verge,「Meta 将购买超过 35 万块英伟达的 H100 GPU」,致力于开发通用人工智能,以驱动计划中的下一代智能服务。

有第三方投资机构的研究估算,英伟达面向 Meta 的 H100 出货量在 2023 年能达到 15 万块,这个数字与向微软的出货量持平,并且至少是其他公司的三倍。扎克伯格表示,如果算上英伟达 A100 和其他人工智能芯片,到 2024 年底,Meta 的 GPU 算力将达到等效近 60 万 H100。

图片

英伟达 GH200 Grace Hopper 超级芯片

面向生成式 AI 的计算,英伟达已经发布了下一代 GH200 Grace Hopper 芯片,以扩大其在该领域的主导地位,而竞争对手 AMD、高通和英特尔也推出了旨在为笔记本电脑、手机和其他设备上运行的人工智能模型提供支持的处理器。

参考链接:
https://www.theverge.com/2024/1/19/24044319/openai-chip-manufacturing-fundraising
https://www.theverge.com/2023/11/15/23960345/microsoft-cpu-gpu-ai-chips-azure-maia-cobalt-specifications-cloud-infrastructure
产业GH200 Grace Hopper英伟达OpenAI
相关数据
英特尔机构

英特尔(NASDAQ: INTC)是全球半导体行业的引领者,以计算和通信技术奠定全球创新基石,塑造以数据为中心的未来。我们通过精尖制造的专长,帮助保护、驱动和连接数十亿设备以及智能互联世界的基础设施 —— 从云、网络到边缘设备以及它们之间的一切,并帮助解决世界上最艰巨的问题和挑战。

http://www.intel.cn/
相关技术
DeepMind机构

DeepMind是一家英国的人工智能公司。公司创建于2010年,最初名称是DeepMind科技(DeepMind Technologies Limited),在2014年被谷歌收购。在2010年由杰米斯·哈萨比斯,谢恩·列格和穆斯塔法·苏莱曼成立创业公司。继AlphaGo之后,Google DeepMind首席执行官杰米斯·哈萨比斯表示将研究用人工智能与人类玩其他游戏,例如即时战略游戏《星际争霸II》(StarCraft II)。深度AI如果能直接使用在其他各种不同领域,除了未来能玩不同的游戏外,例如自动驾驶、投资顾问、音乐评论、甚至司法判决等等目前需要人脑才能处理的工作,基本上也可以直接使用相同的神经网上去学而习得与人类相同的思考力。

https://deepmind.com/
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

语言模型技术

语言模型经常使用在许多自然语言处理方面的应用,如语音识别,机器翻译,词性标注,句法分析和资讯检索。由于字词与句子都是任意组合的长度,因此在训练过的语言模型中会出现未曾出现的字串(资料稀疏的问题),也使得在语料库中估算字串的机率变得很困难,这也是要使用近似的平滑n元语法(N-gram)模型之原因。

通用人工智能技术

通用人工智能(AGI)是具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。通用人工智能是一些人工智能研究的主要目标,也是科幻小说和未来研究中的共同话题。一些研究人员将通用人工智能称为强AI(strong AI)或者完全AI(full AI),或称机器具有执行通用智能行为(general intelligent action)的能力。与弱AI(weak AI)相比,强AI可以尝试执行全方位的人类认知能力。

AMD机构

超威半导体(中国)有限公司专门为计算机、通信和消费电子行业设计和制造各种创新的微处理器(CPU、GPU、主板芯片组、电视卡芯片等),以及提供闪存和低功率处理器解决方案,公司成立于1969年。AMD致力为技术用户——从企业、政府机构到个人消费者——提供基于标准的、以客户为中心的解决方案。

https://www.amd.com/zh-hans
Hopper机构

Hopper开发了一个移动应用程序,它使用大数据来预测和分析机票价格。它的应用程序向旅行者提供他们在航班上获得交易所需的信息,并在航班价格处于预测的最低点时通知他们。

官网,http://www.hopper.com/
推荐文章
暂无评论
暂无评论~