ChatGPT 引领的生成式 AI 的繁荣,推动英伟达成为首家跻身「万亿俱乐部」的半导体公司。
撰文 | Sia
持有英伟达股票要有一颗强大的心脏。
ChatGPT 引领的生成式 AI 的繁荣,正推动英伟达股价持续上涨。上周四,英伟达股票飙升超过 24%,创下历史新高。
隔夜英伟达再次发力,市值突破万亿美元大关,8 倍于英特尔,成为继苹果、微软、谷歌、亚马逊之后,第五个迈入「万亿俱乐部」的美国上市公司,也是首个达到该里程碑的半导体公司。
相比之下,Meta 曾在 2021 年 6 月达到万亿美元市值里程碑,但当时它的名称仍是 Facebook,但该股在短短几个月后跌破这一门槛。Tesla 只完成了 63%,Salesforce 甚至不及加入俱乐部所需价值的四分之一。
然而,就在去年夏天,2022 年 8 月,英伟达曾报告称第二季度盈利遭遇滑铁卢,公司股价一度腰斩。
由于芯片很擅长解决构成加密货币基础的一些数学难题,英伟达 GPU 业务也注入加密货币行业的波动性,数度因加密数字货币退潮而导致股价暴跌:
2018年的一次最大单日跌幅,曾导致公司市值蒸发掉一个 AMD。去年全球加密货币市场崩盘又再次殃及 GPU 业务。
同时,全球数据中心等基础 IT 设施投资收缩也加剧了芯片供应过剩的程度,包括应美国政府要求对中国限供两款最高端 GPU,公司在中国的数据中心销售变少。
不过,深知如何在逆境中成长的黄仁勋一如既往地保持乐观。
2022 年 11 月底,OpenAI 公司发布聊天机器人 ChatGPT,迅速在全球范围掀起一轮围绕大模型的 AI 热潮。GPU 在大模型训练上几无替代品,英伟达股价开始持续复苏。
在公司 3 月举办的 GTC 大会上,黄仁勋称, 向 OpenAI 交付首台 DGX AI 超级计算机后,目前《财富》100 强企业中已有一半以上企业开始使用 DGX,DGX 成为 AI 领域必备工具。
英伟达也将与微软 Azure、谷歌云、Oracle OCI 合作,推出英伟达 DGX 云服务。这意味着,雨后春笋般试图训练自营大语言模型、图片模型的企业,将能直接通过云服务快速实现自己的愿景,极大扩张了英伟达算力的「势力范围」。
5 月 25 日,英伟达发布一季度财报,一季度营收和二季度营收预期都远超预期,股价暴涨近 25%。
其中,AI 芯片所在的数据中心业务,受大模型和生成式 AI 需求影响而暴增。公司预计,二财季业绩也将主要受数据中心业务推动。与生成式 AI 和大型语言模型相关的需求急剧增长,且横跨云服务商、互联网公司、企业级客户以及初创 AI 公司等各类客户。
5 月 29 日,黄仁勋在 Computex(台北国际电脑展)进行了近四年里的首次现场演讲。过程中,他展示了多个与生成式 AI 相关的新系统、软件及服务。
其中包括 AI 超级计算机 DGX GH200,这款计算机将 256块 英伟达 GH200 Grace Hopper 超级芯片整合到一起,由英伟达 NVLink Switch System 提供支持。
DGX GH200 几乎是 2020 年推出的上一代 DGX A100内存容量的 500 倍,可以为大型生成式人工智能模型以及其他应用提供高达 1exaflop 的计算能力,旨在促进前沿的生成式人工智能语言应用、推荐系统和数据分析工作负载的开发。
谷歌云、Meta 和微软将是首批采用该产品的企业。其中的 GH200 超级芯片已全面投产。
据《日经亚洲》报道,黄仁勋在台湾期间,大部分时间说英语,但是当他与台湾当地的供应商、媒体和认出他的路人聊天时,又会很自然地说起闽南语。
「我们与台积电的伙伴关系极为密切,」黄仁勋说,回到台湾后他还与张忠谋一起吃过饭。「这也是加速运算和生成式人工智能的引爆点,所以未来十年我们与台积电的业务量将大幅上涨。」
除了与台积电合作外,黄仁勋表示英伟达也与三星有着密切的合作关系,而且还可能在将来与美国英特尔公司在芯片生产方面进行合作。
作为 AI 超算,GH200 的技术亮点主要体现在存储、互联以及针对 Transformer 加速的优化。
黄仁勋是有底气保持泰然自若的,除了卓越的预见力,他还有强大的执行力。
1993 年,黄仁勋创办英伟达,从游戏显卡市场起步,曾数次濒临破产。直到1997 年发布公司第三代显示芯片才解决基本生存问题。1999 年,公司上市。
随后,英伟达进军移动芯片市场,但铩羽而归。直到多年后在一场学术竞赛中迎来最为重要的转折点:
一个叫做 AlexNet 神经网络在当年 ImageNet 视觉识别挑战赛上一举夺魁。比赛选手选用了两张英伟达为大型 PC 游戏准备的 GTX580,结果训练不到一周便完成了。
深度学习与 GPU 从此走到一起。多年后在接受财新记者专访时,黄仁勋指出,当年英伟达真正的洞见在于意识到深度学习不止于 AlexNet。
「AlexNet 很好,但只是一个小玩意儿,它的长期影响是什么?同样的,自动驾驶汽车的长期影响是什么?机器人的长期影响是什么?」
对于看似简单问题的回答,使得英伟达在 AI 上的转向远快过其他芯片公司。而他们有能力迅速抓住 AI 浪潮、GPU 能够快速落地,则多亏了多年前「不务正业」研发的 CUDA。
GPU 曾经是一个很封闭的体系,研究者想利用 GPU 很费劲。2004年,黄仁勋开始投资做一种能够进行微调的基础软件层「CUDA」,程序员可以根据所需规格对 GPU 进行微调,并将它植入所有的英伟达芯片中。这意味着,任何人用一台配备 GPU 的笔记本电脑,就能开发软件。
最初几年,英伟达在 CUDA 上的投入与产出极不对称,一些投资者也批评他们不务正业和烧钱。但随着 AI 的兴起,这些芯片系统很多最终用在了数据中心的服务器上,也就是那些高性能计算机上。
即使云服务供应商自主开发芯片,他们的企业用户由于用了英伟达的 CUDA,也会倾向于继续使用英伟达的显卡,因为它大大简化了 AI 的开发工作。
曾经可以忽略不计的数据中心业务如今欣欣向荣,让主要创收的游戏业务都相形见绌。搭上人工智能东风,几乎一统深度学习芯片市场,英伟达成为「华尔街的宠儿」。现在,它又继续押注一个全新的数据中心芯片周期——生成式 AI 大模型。
黄仁勋现身在台北 COMPUTEX 大会
最近,回到台湾除了在台北国际电脑展上发表主题演讲,他曾在上周六前往台湾大学,在毕业典礼上致辞。
「你们正站在人工智能的起点,40 年前我们创造了个人电脑、网络、手机和云端,现在是人工智能的时代,你们将创造什么呢?」他对台大的毕业生们说。
黄仁勋出生在台湾的台南市,九岁时随家人移民美国,并在那里读书学习。据说,当年初入美国时被送往了肯塔基州的一所寄宿学校,后来家人才意识到这所学校里都是各种问题青年。
黄仁勋表示,当时自己非但没有在重压下崩溃,反而正是在那段日子里学会了忍耐痛苦。在这样一个起起伏伏的芯片行业,忍耐是一项有用的技能。
「我们距离倒闭永远只有 30 天。」是黄仁勋的口头禅。即便当下如此高光,也有自己的忧患意识。
竞争对手都没停下来,随着美国云服务商加加紧推进人工智能模型提速,他们将会使用更多的自研芯片,规模更小的芯片制造商也将向英伟达发起更为猛烈的竞争。
「我们自己必须要跑得非常快,」在台北的一个活动中回答《日经亚洲》有关中国图形处理器公司与英伟达技术差距的问题时,黄仁勋曾表示。「中国在这方面投入的资源…是相当大的,所以你不能低估他们。」
「无论有任何规定,当然我们都会绝对遵守。但是我认为中国也会利用这一机会来培育他们本国的企业。这也是为什么中国会有这么多图形处理器(GPU)初创公司出现。」黄仁勋说。
「现在如果你还没有涉足芯片产业,但是你希望创办一家芯片公司,你会创办一家什么样的公司?你会创办一个图形处理器公司。中国现在就有一大堆图形处理器公司。」
他认为,现在很难预言美国对中国实施的出口禁令是否会让中国创造出一个有关人工智能的软硬件独立系统。但面对美中关系日益紧张,中国一定会作出应对,全力发展自己的芯片产业,而芯片行业的企业如果想保持强劲的竞争力,就必须继续努力。