AI芯片做到第五年第三代,地平线余凯更新了哪些认知?​

AI芯片做到第五年第三代,地平线余凯更新了哪些认知?​

2015年7月,从百度研究院走出的余凯成为国内最早一批提出AI芯片理念的创业者,一晃五年过去,AI芯片的赛道已经人潮涌动,地平线依旧践行着芯片苦行僧的路子。难得的是,这条先行者的道路正变得更加清晰,更加聚焦。


9月10日机器之心消息,国内AI芯片独角兽公司地平线科技推出第三代AIoT芯片旭日3系列应用SoC处理器,包括中高端、中低端两个档位的产品,旭日3M和旭日3E。

两款芯片均采用了较为先进的16nm工艺;在2.5W的功耗下,分别能够达到等效5TOPS、3TOPS的标准算力。余凯开场便谈道,“这一代芯片是奔着千万级出货量来的。”

所谓的“等效的标准算力”,参考了地平线近日提出的芯片AI效能新标准MAPS(Mean Accuracy-guaranteed Processing Speed),单位为帧/秒,即在该标准下的算力效果等效的标准算力。

在尽可能低的功耗下实现更高算力,是智能边缘端场景所决定的最主要算力需求,“旭日”产品线作为地平线在AIoT领域的发力点,一直聚焦在该方向的迭代与升级。相比一年前发布的旭日二代——在功耗仅增加0.5W的条件下,实现了1TOPS(每秒钟一万亿次)的算力提升。

此外,高性能旭日3M的其他性能参数还包括:4核A53 CPU,搭载地平线第二代BPU伯努利架构,DDR内存为3200Mbps,支持12M摄像头,4K@60fps的视频编解码能力,高效处理不同分辨率的多路摄像头输入。

AI芯片做到第五年第三代,地平线余凯更新了哪些认知?​

在芯片载体之上,地平线延续了算法层面的优势和丰富资源供给,提出为客户提供工具链、感知中台、高精度参考算法等AI芯片周边开发工具,加速AI芯片可发使用。比如采用地平线提供的量化训练方案,可实现浮点转定点过程中的精度损失控制在1%范围内。

AI芯片做到第五年第三代,地平线余凯更新了哪些认知?​

黄畅还表示,将把地平线自身用于嵌入式研发的开放框架、原型框架以及训练平台等中间件开放出来,帮助开发者快速构建产品,实现AI应用落地。

AI芯片做到第五年第三代,地平线余凯更新了哪些认知?​

目前,地平线主要聚焦在智能驾驶、智能边缘两大市场,基于人工智能专用计算架构BPU(Brain Processing Unit)自主研发的嵌入式人工智能视觉芯片“征程”和“旭日”,自动驾驶计算平台Matrix 2,以及基于AI芯片的工具链和丰富的算法样例。其中,“征程”和“旭日”都已迭代到第三代。

 一 需求越丰富,参与的环节越少

在采访环节,地平线AIoT业务线总经理表示,目前旭日一、二代出货量将近百万套,客户主要集中在B端厂商,面向零售、教育行业和传统企业,门禁、通勤类需求。

针对旭日三代,余凯表示三年内预估出货量将达到千万级,目前一家主要客户已经预定了数百万套。过去三年和未来三年,余凯表示,对于市场的信心在于边缘侧的需求越来越丰富,智能电视、视频会议、线下教育、工业制造领域等场景都产生了新的AI计算需求;此外,地平线在产品性能、算法层面都有了更为成熟的积淀。

值得注意的是,为应对边缘市场的碎片化需求,地平线的芯片销售模式正在发生一些变化。从去年推出“系列解决方案和产品参考设计”到今年强调“不做整机,不做主板”,这是一个明显的转变,余凯表示,“地平线将参与更少的环节,做芯片领域最底层的赋能者,不会和合作伙伴抢生意。”

他表示,这样的模式更适合广泛地铺向市场,“他们(渠道商、方案商)卖得比我们自己都多。”

不介入市场与产品方案,不代表局限于芯片本身,地平线正在尝试用平台的形式连接市场,包括打造方案商生态和开发者生态。

AI芯片做到第五年第三代,地平线余凯更新了哪些认知?​

地平线联合创始人兼技术副总裁黄畅表示,地平线后续将设立技术生态大会,为开发者提供最新的芯片、软件资源,开发素材及教程,激励计划。

在活动现场,地平线宣布与智能物联网企业利尔达达成战略合作,共同提供解决方案,与OPEN AI LAB在教育等领域展开深度合作,未来会联合推出面向高校智慧交通和无人驾驶等领域的整体解决方案。

 二 一套更具有实用价值的评价标准

与其它典型的AI芯片相比,地平线将算法特点融入架构设计之中的芯片模式强调高效的算力有效利用率,以便将算法创新的优势发挥到极致。这个理念不仅适用于AI算法芯片的设计,还包括对于评价体系的改观。

地平线方面认为,业界目前惯常使用的芯片评测标准有两种:

  • 一是峰值算力。由客观的逻辑单元和计算资源决定,但峰值算力只反映AI芯片理论上的最大计算能力,而非在实际AI应用场景中的处理能力,具有很大的局限性。“大部分效率低于30%”,黄畅说道,“这意味着有大概70%的算力不能充分利用。”
  • 二是较为知名的基准测试组织MLPerf,其采用的模型少且更新速度滞后于算法演进的速度,无法及时反映算法效率的提升以及各种精度下芯片能够达到的计算速度,因而无法描述芯片AI性能的全貌。

而他们提出的新标准MAPS则更关注任务最终效果与性能,包容任务执行时可采用的所有网络选择,并在合理的精度范围内,评估芯片的平均处理速度。所谓的真实AI效能,应该在芯片的理论峰值计算效能的基础上,结合软硬件计算架构优化后的有效利用率、AI算法效率指标。

AI芯片做到第五年第三代,地平线余凯更新了哪些认知?​

黄畅介绍,该标准旨在应用场景中最常见的精度保障范围内,考察每颗芯片的平均处理速度。具体到旭日3而言,针对Google 提出的 EfficientNet(在同样精度下,性能最好的网络)的性能超越当前业内领先的 11.4TOPS 算力的芯片。

谈道地平线自身提出的新评价标准MAPS(Mean Accuracy-guaranteed Processing Speed),余凯认为,其意义在于让业界更加关注芯片的实际效用。某种程度上,也是营造一种公平、透明的AI芯片市场环境的努力。

但这项标准由涉及到自身利益的地平线提出,其权威性和公正性有待考证。余凯表示,后续将把MPMS算力测试标准开源,让开发者进行更多测试和验证。

产业智能芯片地平线
暂无评论
暂无评论~