Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

宇多田作者

达摩院芯片团队是 1/2 个平头哥公司, 负责人骄旸称创业才刚刚开始 | 对话

「我们就相当于阿里下面的一家创业公司,做的是从 0 到 1 的事情。」

一个「平头哥」,不一定能让阿里做出芯片;但这家将完全独立运营的公司,却几乎集达摩院全院之力。

如果说骄旸带领的达摩院 AI 芯片团队位于「食物链最顶端」,那么达摩院旗下的 AI Labs(人工智能实验室)、城市大脑实验室、智能交通实验室等产业向研发团队,也正在为这块「平头哥芯片」贡献更加多样化的测试环境。

譬如骄旸博士已经向之能证实,芯片团队与王刚博士带领的自动驾驶团队已经在计算机视觉算法训练方面展开合作。

尽管从 2014 年阿里投资中天微开始,再到近年来涉及到多家芯片明星创业公司的投资与收购项目,都能看出阿里对于半导体产业的觊觎。但达摩院芯片团队在今年年初的正式成立,在一定程度上显示出阿里终于下定了的某种决心:

「我们相当于阿里第一个以自研芯片开发为主要目的的专业芯片团队,专攻 AI 芯片。现在平头哥公司成立,我们也将逐渐融入到平头哥公司的常规运营中。」骄旸在采访中表示。

成立 4 个月,这个团队就公开宣布正在研发一款名为 Ali-NPU 的神经网络芯片,主要用于图像视频分析、机器学习等 AI 推理计算,其团队对外宣称「性能功耗比将是同类产品的 40 倍」。

但就目前来看,团队的主要任务还集中在芯片架构的设计上,芯片的用途也是以「优化自有业务的需求」为主,譬如阿里云的数据中心,可能有计划做一些替换 GPU 的部署,当然,包括解决城市大脑以及自动驾驶软硬件的算力问题,也在目前这个芯片团队的工作规划范畴内。

作为从华为出来的「半导体老人」,骄旸目前隶属于达摩院计算技术实验室,负责组建芯片开发工程团队。他认为芯片制造不太可能做到「弯道超车」,而是应该去思考「换道超车」:

「如果我们重复大芯片企业的路径,像 CPU、GPU 上的比较成熟的 IP,要去追赶的话,实际上挑战非常大。但因为 AI 而出现的新需求会驱动产业『造』一个全新的硬件和全新的架构。」

但是,目前市场上的很多相关创业公司,都被骄旸称为「PPT 公司」,没有经过市场的考验,「画个架构图就出去拿融资了」。

因此,他认为经过一两年的「淘沙」,真正做事的公司会脱颖而出,但用心做也不意味着就能做出好的划时代的产品,至少一两年肯定是做不出量产芯片来的。

「所以你不能光看一代、两代,比如说像华为,做自主 IP,经过十多年的打磨,才有今天的成就。芯片不可能一两年做出来。

在阿里达摩院之下,我们有很大决心的投入全部力量。芯片很大程度上一方面需要有比较长期的技术积累,另一方面需要比较持续稳定的投入。」

「说白了,我们就是集团下面的一家创业公司,做的是从 0 到 1 的事情。」

以下是根据云栖大会采访精选的内容:

公司为什么要叫「平头哥」?

骄旸:这个「平头哥」是这样的,我们也是最近这一两周,我们团队大概提了一些建议,其中有一个名字就是「平头哥」,当时我们想这个名字的时候,可能觉得这个名字挺好玩的。

另外也觉得它代表了动物的性格,不怕失败,无所畏惧,小而伟大,这种性格我觉得挺符合我们做芯片这件事的,包括我们这些愿景。

从这个角度。这个名字报上去之后,最后应该是马总决定的。

「平头哥」这家公司,阿里成立这家公司的初衷或者说对这家公司的计划是什么?会不会有独立融资的计划?

骄旸:我们这个团队是今年年初的时候成立的,这个团队目前在阿里是相当于第一个以自研芯片开发为主要目的的专业的芯片团队。目前 AI 芯片是我们一个主要的突破点。

关于成立半导体这个公司这件事,是我们集团不久前做的一个新的决定,一个重大决定。我想这件事,确认了阿里在芯片领域的战略布局并不是仅仅做一些自研的芯片,而是要去涉及更多单独的业务,这个会比较长远。

「平头哥」这个公司以后是否会统筹阿里巴巴集团所有关于芯片的业务?你们跟中天微将会是什么关系,组织架构是怎么样的?

骄旸:关于成立芯片公司这件事,是刚刚做出的决定,具体我们的组织结构是什么样,还在酝酿和讨论中,没有最后定。

但至少目前,我们会把自研的 NPU 团队和中天微团队都放进「平头哥」半导体公司,这是我们现在所了解的情况。

这个新的公司是指 IC 设计公司,不会涉及生产环节对吗?

骄旸:这个公司的名字后缀叫半导体,其实有点大。就目前来说我们主要关注的还是做 IC 设计这一端,基本上是从架构到前端设计,是我们这个阶段的重点。

NPU 这部分我们打算怎么做?

骄旸:我们选择 AI 芯片作为入手点,是考虑到阿里有非常广泛的人工智能方面的应用,所以之前行癫也提到 ABCDE,是算法、大数据、计算力、领域还有生态。

我想阿里是少有的几家公司是能够同时具备 ABCDE 的公司。因为很多公司无论是创业公司还是成熟的半导体公司,还是其他的软件公司,很难同时具备从算法到计算能力到生态的五个领域。

我们是不是通过去获得架构的授权去研发的?是怎么获得架构的?选择这个架构的原因是不是因为它是开源的?然后考虑到了成本上的因素?

骄旸:我想这个问题是关于中天微这部分。集团几个月前宣布收购中天微,中天微目前国内在 CPU 领域有自主知识产权的 IP 公司,它目前已经产业化,大概有 8 亿多的成功的流片,用他们的 IP 累计有 8 亿的芯片。

这部分他们主要是在嵌入式方面,有自主的 CPU 的 IP;而我这边主要是代表 NPU 这边,在公司集团内部做了一些自主研发。

将来我们两个部分会融合在一起(在新成立的半导体公司内),相当于互补。因为我们在 AI 加速、AI 芯片领域,包括云计算、数据中心这方面,跟中天微在嵌入式领域的优势,其实两边是很好的互补与合作关系。

因为 AI 芯片现在有很多,现在市场有很多创业公司也在做,无论是芯片企业还是其他互联网公司也在尝试做 AI 芯片,不同的公司的做法不太一样,那我们的做法就是跟我们的 ABCDE 整合起来。

阿里在平头哥公司身上会有多大的投入?

骄旸:关于投入计划,芯片绝对是一个非常大的投入的产业,阿里巴巴也一直在这方面做持续的投入。关于具体的数字也不能说。

总之要一步一步来,我们先把第一块芯片的流片搞出来,有了成功的经验我们这个团队才可以做更多的事情。

你们在人力投入,特别是选拔人才这方面,有什么样的标准?您会看中哪方面工程师哪部分能力?

骄旸:目前来说我们团队还是比较小的,是一个小而精的团队,我们现在招聘的工程师都是有很多年,甚至十多年、二十多年在芯片领域的,在架构设计上很厉害的专家,这也是当时的招聘标准。

我们在集团里面,相当于是一个创业公司。

所以我们其实就是从 0 到 1 做这件事情,从这个意义上讲,我们跟一些创业公司很类似。所以我们需要非常有经验的工程师进入团队,就我们现在取得的成绩来说,也是跟我们团队的专业素养非常有关系的。

当然,我们跟创业公司不同的是我们背后有强大的支撑,这是其他创业公司不具备的。我们从做这件事情来说,绝对是从 0 到 1。

既然芯片制造做起来很重,时间时间耗费很长,那这对阿里巴巴的股价会不会有一定的影响?因为这个投入可能是天文数字。

骄旸:我们到底做什么样的芯片,针对什么样的业务,这实际上是要经过仔细调研之后做出的决定。

我们不会说简单重复别人做过的东西,我们有句话叫重新造轮子,重新造轮子对我们来说是没有任何优势的。

所以我们切入的点,一定是我们看到公司里的业务对新芯片有了很强的需求,针对这些业务再去做创新。

此外整个达摩院就是一个有非常强大的算法团队,这方面的优势我们要充分利用。再结合这个去选对题目,我觉得选对题目是成功的一半,如果选错了题目,你再努力走的方向也错了。

这点我们一定非常小心,因为公司内部在评审我们项目的时候,也是做过非常仔细的讨论的。

NPU 芯片是按多少纳米的工艺来设计的,未来准备找哪家公司代工?关于 2019 年推出的第一款芯片,要达到一个什么量级?

骄旸:关于具体的在哪里流片,还不能具体讲,到流片的时候我们还会有发布会,那时候会把更细的技术细节给大家公布,包括架构方面的细节,目前还不方便去讲这些细节。

关于这个量的问题,我们也不期望我们一下子达到像华为手机那样的量级。一开始的话一定是针对我们的一些业务,像我们刚才讲的是我们本身阿里云的业务,这实际上是给自己内部用的,我们可能在自己的服务器上把 CPU 和 GPU 换掉,这个完全是对内的业务量。

这个自有业务主要指的是我们的数据中心,大家都知道阿里云现在在张北和千岛湖都有两个非常大的数据中心,这里面对于 AI 芯片的用量是非常大的,所以其实我们跟华为所说的手机芯片可能还不太一样,第一批我们芯片的场景更多的是在数据中心里面。

还有一部分是针对我们的城市大脑,这是我们的主要业务。至少目前不是卖芯片。我们主要的目的是产生比较大的性价比优势来帮助自己的业务进行优化升级。

我们在推广城市大脑的时候,看到目前的一个比较挑战的地方是我们的硬件成本如何能降低下来。

因为我们要用通用的 GPU,大家知道现在是非常昂贵的。那我们的城市大脑产品推广到市场上的时候,就会有比较大的硬件成本问题。

芯片的量达到多少,您觉得这个价格会相对于 GPU 更低?

骄旸:我们内部有做过可行性评估,但具体的数字我不好讲。

评估了什么呢?我们采访所谓集团内部的几条业务线,根据他们现在的用量,以及未来大概三年左右的业务量,做一个 GPU 替换可能性的评估。包括我们的生产成本,流片成本,我们都是经过财务核算的。

谷歌说它的 TPU 会通过云服务来提供,阿里的芯片也是通过阿里云的云服务来提供吗?

骄旸:第一,我们主要还是用于自己内部的业务,一个很主要的方面就是阿里云的云计算,我们阿里云也要跟国际的云服务商对接,降低我们的云服务成本。

大数据也好,云计算也好,降低我们云计算的最低成本,我们的云服务才有竞争力。所以 NPU 一个很大的目标是要降低我们的成本,提高我们的算力,这确实是我们很重要的目标。

您刚才说芯片可以用在阿里的很多场景里,我想知道芯片跟现在阿里做的自动驾驶方面,怎样用到现在的芯片产品?

骄旸:因为自动驾驶也是很重要的应用,首先它是一个 AI 推理的应用,也是基于视频图象处理这方面,所以实际上跟我们第一款 NPU 的设计非常契合。

所以我们也把它作为一个比较主要的业务方来看待,跟王刚的团队也一直保持交流合作,包括他们现在做的一些算法的研究。我们也在 NPU 设计上,保证它的算法可以在关于自动驾驶各类硬件上比较好地执行,有做过这方面的优化。

芯片属于精密制造,如果要实现「弯道超车」,那么路径应该是什么样的?

骄旸:前段时间马老师提到一个很重要的概念,就是说普惠,我们做芯片,实际上是要达到普惠天下的愿景,这个实际上我觉得当初听到这个的时候,我觉得这是很特别的,也是比较感动我的地方。

我想四年前开始,从马老师最开始投第一步向中天微的投资也好,很多年前开始有了,这个布局是一个长期的布局。从互联网公司涉足半导体,这是一个非常大的决定,因为大家都知道芯片产业是需要很多积累的,无论技术上、投入上、人才上,这不是一个小的决定。

所以在这个过程里,我们想先通过投资的方式,先在这个领域试水,先了解这个产业的情况是什么样的,然后通过我们投资中天微积累一些经验,包括中天微他们设计的芯片 IP,怎么跟阿里的业务先结合。

等这个过程酝酿到一定阶段的时候,我们就开始尝试做自主的 AI 芯片的设计,这实际上是一个逐步的发展过程。

所谓芯片弯道超车,阿里其实一直提倡的是「换道超车」,不是简简单单是为超越而超越。因为如果我们重复大芯片企业的路径,像 CPU、GPU 上的比较成熟的 IP,要去追赶的话,实际上是挑战非常大的事情。

AI 近年来大热,给我们切入芯片领域提供了很好的机会。因为 AI 的应用是一个全新的应用,我们大家知道中国在人工智能的应用领域上,实际上还是世界领先的,包括一些研究的应用场景跟算法上,是不输其他发达国家的。

所以这实际上给我们在芯片提供了很好的切入点。这个切入点就好比当初 PC 时代造就了英特尔,移动互联网的时候造就了高通和苹果,我想这个机会是一个时期甚至更长时间都难遇的历史机遇点,AI 是个新的大潮,这时候肯定会造一个全新的硬件和全新的架构。

我们下一个伟大的公司,可能就在这个时代会应运而生。如果我们做了我们的定制芯片做得非常好,我们可能会成为下个时代我们的弄潮儿,这是整个大的背景。

国内的公司可能在这方面起步晚,现在无论是弯道超车还是换道超车,您认为多久才能够超越国外的这些老牌的技术公司?

骄旸:我本身有十多年做芯片的经验,对 GPU 架构的缺陷我非常了解,所以我觉得这是可能做到的。

尤其在阿里达摩院之下,我们有很大决心的投入全部力量。芯片很大一个程度是需要有比较长期的技术积累,也需要比较持续稳定的投入。

所以你不能光看一代、两代,比如说像华为,做自主 IP,经过十多年的打磨,才有今天的成就。

所以我想我们做,一定是有这样的计划的。我觉得这是阿里具备其他创业公司所不具备的东西,因为我们有自己的愿景驱动。

包括以前阿里云的故事,大家也很熟悉,那么多年,前面三年五年,投入太多太多,顶住了很大压力,最终成功了。我想有这个意识,大家要相信阿里做芯片也是非常有可能的。

您研究 GPU 研究了很多年,会不会让你在做芯片的时候陷入一种经验的陷阱里面去?

骄旸:我们很多时候也会考虑这个问题,所以我们做的事「颠覆」,要把它做成跟 GPU 完全不同的设计。

我们那个团队虽然都是在 GPU 和 CPU 领域设计有多年经验的工程师,但是我们做的完全是基于 AI 算法优化的架构,是跟 GPU 有很大不同的架构。

从移动互联网时代到 AI 时代,芯片这个产业因为新公司角色的加入,在产业链关系上会发生什么样的变化?

骄旸:以前传统的 PC 时代,芯片和跟系统厂家还有软件,实际上是完全分层的。你看我们的 PC 时代英特尔,主要是提供核心的 CPU 技术,像戴尔那些是提供 PC 整机系统的,微软是提供软件。

到移动互联网,我们看到一个特点是整个系统机做整合,做的最好的是苹果。苹果、三星都是走系统垂直整合的道路,它从整机的设计到 SOC 再到里面的关键 IP,是垂直整合的。

我想到 AI 的时代,这个趋势会再往前进一步,这个进一步是指这个垂直整合已经到了互联网的级别,因为以前还是个硬件的垂直整合,我觉得现在和将来是从软硬件一起对话,从生态到应用,一直整合到最终的硬件产品甚至于芯片,一个高度垂直整合的产品,这是我个人的看法。

此前中科院的一个专家质疑说现在所谓的 AI 芯片是伪概念,不存在所谓的 AI 芯片,您是否赞成?

骄旸:关于什么是 AI 芯片,以及为什么会出现这么一个造芯潮,实际上跟我们产业遇到一个很大的问题有关。

为什么不是多年前有很多公司去做芯片,比如 PC 上的 CPU 或者是 GPU,因为人工智能的确推动和发现了现有硬件架构很难支撑大家对 AI 的算法和应用的需求。

像谷歌这样的互联网公司,为什么要切入 AI 的芯片领域?因为他们看到了一个很大的机遇,你在 GPU 上还能再提供几倍甚至十倍以上的算力。

那你说 AI 芯片是不是伪命题?很多公司的确是在赶热潮,它也是做 AI 的,但是到底怎么样大家不知道。因为很多都没有真正经过市场的考验,很多公司都是 PPT 的状态,画个架构图出来就去拿融资了。

实际上我觉得这是一个短期的现象,就像大浪淘沙一样,经过一两年的筛检肯定会有真正的金子出现。但是这个趋势告诉我们,市场的确需要一个新的架构。

产业达摩院人工智能芯片阿里巴巴
1
暂无评论
暂无评论~