张健作者

华为海思的处理器研发逻辑

昨天,华为又刷屏了,原因就是其千呼万唤的Arm服务器芯片终于正式与大家见面了。

作为中国大陆半导体界的第一宠儿,华为海思的动向始终是热度最高的。在过去的一年里,关于Arm服务器芯片的兴衰一直是业界的一个热点话题,而华为也被紧紧地绑定在了这个话题当中,使得热度翻倍。

之所以如此,是因为业界一直在热议的海思Hi16xx服务器处理芯片,正是基于Arm架构的,Hi16xx是海思内部的研发代号,而其最终版本是Hi1620,这也正是昨天华为正式发布的产品——鲲鹏920。实际上,华为之前就有过基于Arm架构的服务器芯片,如基于Cortex-A57的32核产品,只不过并没有大规模推广,

处理器一个都不能少

海思设计的芯片覆盖范围还是很广泛的,包括无线网络、固定网络、数字媒体等领域,但最受关注、热度高的莫过于处理器芯片了,包括手机处理器SoC、服务器芯片,以及AI芯片。

论技术难度和进入门槛,手机用处理器显然是最低的,且其市场规模可观,量大可带来不菲的经济效益,这在华为身上有淋漓尽致的体现:该公司2018财年营收超过了1000亿美元,其中手机收入就占50%左右,而华为的所有手机中,采用自家麒麟系列处理器的,占比也超过了50%,可见,华为在手机处理器高投入产出比方面,实现了教科书般的操作,当然,这也不是一时之功,而是多年坚持、投入的结果。

显然,相对于手机SOC而言,做服务器芯片的难度和门槛就高得多了,而且是做非X86架构的芯片,在当今的服务器市场,X86系处理器的市场占比超过90%,要想在这样稳固的生态当中夺食,谈何容易!而国内外一批Arm系的厂商正在试图改变这一让很多服务器应用商感到无奈的局面,因为它们在X86系面前几乎毫无议价能力,有的甚至被任意宰割。

华为在Arm服务器芯片研发方面也是积累了多年,弯路自然是难以避免的,初期推出的一些芯片显然不尽如人意,比如基于Cortex-A57架构的32核产品。

在经过多年的研发和市场经验积累后,此次华为终于推出了鲲鹏920。这款芯片有64个内核,主频2.6GHz,是基于ARMv8指令集研发的高性能服务器处理器,采用台积电7nm制程工艺,号称是最强Arm服务器芯片,比业界标准性能高出25%。据悉,鲲鹏920的大部分性能提升来自优化的分支预测算法、增加的OP运算和改进的内存子系统架构。

华为董事会董事、战略Marketing总裁徐文伟介绍,在SPECint基准测试中,鲲鹏920得分超过930分,比行业基准高出近25%,同时功耗降低30%。

基于鲲鹏920,华为推出了三款泰山(ThaiShan)系列服务器,包括TaiShan 22080、Thaishan 5280/5290、ThaiShan X6000,分别面向均衡服务器、存储服务器及高密度服务器市场,主要应用于大数据、分布式存储、Arm原生应用等场景。

推出鲲鹏920后,华为要做的、也是最为关键的,就是生态建设和培育,因为在强大的X86系生态面前,要想拿到客户订单,绝对不是只靠一两款处理器芯片和两三款服务器产品就可以的,行业组织和平台的渗透与建设、相关硬件和软件的协同等等都非常重要,同时也是最难做的。不过Arm系服务器厂商有可以依仗的,那就是市场有这个需求,需要打破垄断,因为垄断到了一定程度,就会出现转机。

可以说,手机处理器和服务器芯片都属于传统业务了,当然其技术和架构也在随着市场需求发展而迭代。与它们相比,人工智能(AI)处理器显然是新生事物,虽然AI概念本身多年前就已被提出,但真正应用于市场,并做出相应的处理器,也就是最近几年的事情。

在AI方面,华为也是不甘人后,2018年10月,该公司推出了两款自研AI芯片:基于达芬奇架构,首批推出7nm的昇腾910(Ascend 910)以及12nm的昇腾310。华为称昇腾910作为单芯片计算密度最大的AI新品,算力远高于Google研发的TPU V3、NVIDIA V100显卡,半精度(FP16)运算能力为256TFLOPS,整数精度(INT8)512TOPS,支持128通道全高清视频解码(H.264/265),最大功耗350W。

昇腾310芯片的最大功耗仅为8W,主打极致高效计算低功耗AI芯片。半精度(FP16)运算能力8TFLOPS,整数精度(INT8)16TOPS,支持16通道全高清视频解码(H.264/265)。主要适用智能手机、智能设备等低功耗产品上。这可能意味着未来华为麒麟处理器的NPU将会全面转向自研,不再需要向寒武纪公司购买IP内核集成。据悉,这两款AI芯片和大规模分布式训练系统都将在今年第二季度推出。

自主可控真的很难,但必须做

在手机处理器方面,从2009年,海思推出第一款面向公开市场的K3处理器开始,一直到2018年推出麒麟980,华为海思花了10年的时间,仅麒麟980项目研发耗资就超过3亿美元,其在2015年立项,包括联合台积电进行7nm工艺研究、定制特殊基础单元和构建高可靠性IP、SoC工程化验证,最终定型、量产,前后投入36多个月,1000多名半导体设计与工艺专家,5000多块工程验证开发板。

另外,在手机处理器研发方面,华为海思与三星、苹果有所不同,后两者设计芯片的重点是应用处理器,而海思则更看重核心技术——基带的研发。因为基带芯片是联系电信设备与手机的纽带,而目前市场上虽然半导体IP很多,但要想买到手机基带IP事比登天,要买也只能从高通那里买现成的基带芯片,可见其研发难度之高,苹果与高通的官司,相争的核心点就是基带。而要自己搞研发、创新,就需要大量的投入,特别是基础性芯片研究。

2014年,华为的研发投入比A股400家企业的总和还多。2017年,华为研发费用高达897亿人民币,大大超过苹果和高通。过去10年,华为投入的研发费用超过3940亿元,位居世界科技公司前列。

2012年,任正非曾有一次内部讲话:芯片可能暂时没有用,但还是要继续做下去。一旦公司出现战略性漏洞,我们不是几百亿美金的损失,而是几千亿美金的损失。我们公司积累了这么多财富,这些财富可能就是因为那一个点,让别人卡住,最后死掉。这是公司的战略旗帜,不能动摇。

虽然华为自主研发的决心很强,投入很大,而且其在国内属于顶尖水平,但在很多方面依然很难实现自主可控,特别是在手机处理器和服务器芯片方面。

以2017年引爆市场的麒麟970为例,其狠心的8核CPU、12核GPU还是躲不开Arm这样的IP大佬,这在国家之间的贸易争端,以及意识形态和政治力的作用下,对于Arm的依赖使得产业风险难以避免。

而Arm服务器芯片对于Arm的依存度更高,也是一把双刃剑。

由于手机处理器和服务器属于传统产业,生态已经形成,非常牢固,这方面,Arm服务器芯片最为典型:即使被X86占到了90%多的市场份额,要与其争食的依然是我们不能自主可控的Arm,可见生态优势是多么的重要。这方面,后来者有先天缺陷,不可避免。

而要想打造自己的生态,主要希望还是在新生的产品和应用上,典型代表就是人工智能,这也正是华为的攻坚重点。其推出的昇腾910和昇腾310,就是采用自主研发的全新架构——达芬奇。对此,当时的华为轮值董事长徐直军表示,之所以不再基于之前的芯片架构,而是做一个全新的架构,是因为目前市场上没有任何架构可以实现全场景覆盖。华为的昇腾系列则可以实现全覆盖。华为需要覆盖从云、到边缘、到端到物联网端,需要全新的架构,创造力的架构。

据悉,华为还会在AI芯片研发上继续投入更多精力,在2019年,还会发布昇腾系列三款AI芯片,并且开始提供AI云服务。

结语

综上,华为的处理器研发逻辑就是:以门槛较低的手机处理器为切入点,不断积累研发和市场经验,逐步过渡到服务器领域,以及新兴应用(目前是AI),不断向更高端芯片进军。

在自主可控方面,在传统产业,如手机和服务器,在已有生态牢固的情况下,更多地从市场角度考虑,先能够站住脚,然后徐图之,争取逐步加大自主可控比例。而在新兴应用领域,则力图尽早构建属于自己的架构和生态,在产业发展前期就争取占领先机,从而在核心竞争力方面,摆脱对外界的依赖。

半导体行业观察
半导体行业观察

最有深度的半导体新媒体,实时、专业、原创、深度,30万半导体精英关注!专注观察全球半导体最新资讯、技术前沿、发展趋势。

产业海思华为
1
相关数据
高通机构

高通公司(英语:Qualcomm,NASDAQ:QCOM)是一个位于美国加州圣地亚哥的无线电通信技术研发公司,由加州大学圣地亚哥分校教授厄文·马克·雅克布和安德鲁·维特比创建,于1985年成立。两人此前曾共同创建Linkabit。 高通公司是全球3G、4G与5G技术研发的领先企业,目前已经向全球多家制造商提供技术使用授权,涉及了世界上所有电信设备和消费电子设备的品牌。根据iSuppli的统计数据,高通在2007年度一季度首次一举成为全球最大的无线半导体供应商,并在此后继续保持这一领导地位。其骁龙移动智能处理器是业界领先的全合一、全系列移动处理器,具有高性能、低功耗、逼真的多媒体和全面的连接性。目前公司的产品和业务正在变革医疗、汽车、物联网、智能家居、智慧城市等多个领域。

华为机构

华为成立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。华为的主要业务分布在无线、网络、软件、服务器、云计算、人工智能与大数据、安全、智能终端等领域,发布了5G端到端解决方案、智简网络、软件平台、面向行业的云解决方案、EI企业智能平台、新一代FusionServer V5服务器、HUAWEI Mate等系列智能手机、麒麟系列AI芯片等产品。目前华为拥有18万员工,36所联合创新中心,14所研究院/所/室,业务遍及170多个国家和地区。

http://www.huawei.com/cn
寒武纪机构

寒武纪科技成立于2016年3月,是全球智能芯片领域的先行者,宗旨是打造各类智能云服务器、智能终端以及智能机器人的核心处理器芯片。公司创始人、首席执行官陈天石教授,在处理器架构和人工智能领域深耕十余年,是国内外学术界享有盛誉的杰出青年科学家,曾获国家自然科学基金委员会“优青”、CCF-Intel青年学者奖、中国计算机学会优秀博士论文奖等荣誉。团队骨干成员均毕业于国内顶尖高校,具有丰富的芯片设计开发经验和人工智能研究经验,从事相关领域研发的平均时间达七年以上。寒武纪科技是全球第一个成功流片并拥有成熟产品的智能芯片公司,拥有终端和服务器两条产品线。2016年推出的寒武纪1A处理器(Cambricon-1A)是世界首款商用深度学习专用处理器,面向智能手机、安防监控、可穿戴设备、无人机和智能驾驶等各类终端设备,在运行主流智能算法时性能功耗比全面超越CPU和GPU,与特斯拉增强型自动辅助驾驶、IBM Watson等国内外新兴信息技术的杰出代表同时入选第三届世界互联网大会评选的十五项“世界互联网领先科技成果”。目前公司与智能产业的各大上下游企业建立了良好的合作关系。在人工智能大爆发的前夜,寒武纪科技的光荣使命是引领人类社会从信息时代迈向智能时代,做支撑智能时代的伟大芯片公司。

http://www.cambricon.com/
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

推荐文章
暂无评论
暂无评论~