Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

Nicole Hemsoth作者

模拟AI或让这家公司变成独角兽

发展至今,人工智能推理有两种趋势,目前只有少数几家公司深入其中。

一个趋势将我们带回到模拟计算引擎的未来,模拟计算引擎可以大大降低功耗和潜在成本,但对复杂性的创建和避免会产生一些影响。很快就会有更多信息。

第二个趋势是,任何公司进入推理市场时都会采用类似的方法,通过对数据中心和边缘推理的双重关注来对冲他们的赌注。更具体地说,在边缘设备中使用相同的体系结构,因为它可以像加速器一样塞进PCIe。

虽然我们谈论AI推理的趋势,但请记住,在数据中心,CPU仍然是王者。卸载加速模型尚未在工作流程的这个特定部分中流行,但随着训练有素的模型复杂性(和ROI)不断增长,它将变得有意义。足够让大公司去建立自己的公司。也就是说,除非有人这样做,否则在经济上和技术上都是不可行的。

其中一家属于融资型的少见的推理初创公司刚刚获得了很多流动资金,以资助他们进军数据中心并应对上述挑战。我们去年介绍的Mythic,宣布了3000万美元的B-1系列赛,总筹资额达到8600万美元。

如果您必须跳过我们的体系结构简介,那么这个简短的故事将从2013年开始,这家公司就开始着手进行数十年的模拟设备方面的大量工作,并声称已经完善了一些极为复杂的模拟到数字(然后再返回)电路,以及对复杂神经网络推理操作的优化(CNN,RNN,着眼于变压器网络和谷歌和其他超尺度研究实验室提出的人工智能的其他新方法)。

有人可能会说,Mythic的数据中心野心会受到对边缘设备的过分强调的影响,而边缘设备才是真正的主流机会所在。尤其是因为该市场主要由超大型计算机组成,这些计算机要么测试一个新设备需要足够长的时间,以决定自己构建一个新设备,要么在他们的芯片发现这些数据中心的内部之前,将一家初创企业置于资金短缺和开发失败的岌岌可危的境地。

虽然可以在新兴的边缘主流中保持利润率,但数据中心的思维共享潜力是香饽饽。这是几家旨在培训和推理的人工智能芯片初创公司都在寻求的,但考虑到潜在大客户的数量有限、他们倾向于按规模建造和购买,延长了硬件鉴定时间,很难说这些需求中是否有一个得到了很好的满足。需要大量的软件集成,对高级路线图的需求……直截了当地说,数据中心可能只是一个遥远的希望,即使是对最好的技术和开发来说。

但是,正如Mythic首席执行官迈克·亨利(Mike Henry)告诉我们的那样,有很多方法可以绕过那些阻碍他们获得大客户的障碍。而且他认为他们或许能够做出让最大公司无法拒绝的推断。嗯,更准确地说,是他们不愿意拒绝,因为从开发和成本的角度来看,这是没有意义的。

“关键是要有一个真正与众不同的东西,那就是那些超大型计算机无法自行建造,如果他们不得不这么做的话,一定是成本足够低在驱使他们,”亨利说,他确实有这样一个观点。“这些公司拥有大型系统和硬件团队,但他们擅长构建大规模数字集成和系统。除了一些网络通信结构之外,我还没有看到这些公司生产出任何复杂的模拟芯片。“这并不是说团队在这方面并不努力,但正如亨利解释的那样,需要花费数年的时间来完成所有这些工作。模拟/数字转换是正确的,更不用说其设备在边缘或数据中心工作所需的许多其他优化。

“如果你看一个相对简单的模拟设备,比如德州仪器的汽车传感器,芯片上有8个模数转换器。它们具有高采样率,8-16位精度,传感器上可能有8个芯片,“他说。“我们的问题是把大约22000个这样的芯片,同时保持大致相同的功率预算。这些转换器在芯片上的规模远远大于之前的任何转换器。而且我们必须弄清楚如何使它们变得小而薄,以便在不影响功耗预算的情况下将它们与闪存排列在一起。”

训练一个模拟设备进行数字训练的神经网络并不是一项小任务。亨利说,大多数深度学习工作的复杂数据流根本不适合模拟。“我们必须构建大量的数字环绕结构,以便为这些网络提供可编程和灵活的架构。当我们考虑接下来几年需要什么时,我们意识到它在计算方面有很多原始的暴力矩阵数学能力,没有任何特定的网络加速器,而是内置的数字转换能力数据输入和输出以运行CNN,RNN,张力和变压器网络以及那些新事物。我们花了五年多的时间,可以跟上拓扑结构的变化。但关键是模拟到数字(反之亦然)。”

人工智能是半导体行业所知的一种全新的工作量。它注重低精度,内存密集,从控制流的角度来看,计算很简单。使用现有内存进行模拟计算可以解决摩尔定律无法解决的瓶颈。”

这一点很难说。谷歌、Facebook、亚马逊和其他一些公司当然可以找到并利用专业知识来构建模拟设备,但是为什么当复杂性和提升时间很长时,他们会为驱动和设备本身的重新改造而烦恼,现有的且相对便宜的存储技术意味着成本/收益开始看起来有些不平衡。唯一的优势是完全控制架构以实现开发速度软件的进步,但即使这样也是一个延伸。

另一方面,这个星球上有很多模拟的专业知识,很多容易获取的内存,制作推理芯片可以成为任何人的游戏,在这基础上,事情将变得更容易,那些初创公司可以采用与Mythic相同的双市场方法。但这只是商业和竞争的工作方式,正如我们在最近的一个风投小组所听到的,推理仍然是任何人都可以玩的游戏。

“当然,在研究生院,有人可以组装一些显示模拟计算的电路,但这与大规模生产相差甚远;这并不是把它运送到一堆设备中,或者在TensorFlow中加载经过训练的网络。最困难的部分在于加载精度可忽略不计并确保数百万芯片的一致性,”亨利补充道。

Mythic在过去几年中所延伸的研究和开发风险可以通过强调市场仍然在很大程度上未定义且可能对某些利基市场具有爆炸性的边缘来缓解。这使得对双重策略的新一轮投资听起来不如那些注入AI加速器的资金那么可怕,AI加速器在框架和事实上的设备改变很久之后才最终进入市场(正如我们在培训加速器时看到的)。

我们非常希望听到一批全新的芯片创业公司试图从边缘剥离。此外,我们还希望听到一些知名公司几十年来在模拟设备领域取得了巨大的成就,并最终有机会利用当年最热门的工作量来激活他们的业务。像这个领域中的许多其他事情一样,市场上的“解决方案”将远远超过那些复杂到可以保证任何事情都不受限制的人。但是,如果问题足够持久,那些植根于人工智能的问题会推动硬件的真正战斗。

基于这点,最大的模拟人工智能推理芯片故事来自IBM,它也在开发基于8位相变存储器的设备。

Mythic的故事也告诉我们,这是关注世界记忆制造者正在发生的事情的好时机。虽然数量不多,但在Mythic的新闻中,见到了业界巨头美光公司(Micron),美光风险投资公司(Micron Ventures)也加入了这轮融资。

半导体行业观察
半导体行业观察

最有深度的半导体新媒体,实时、专业、原创、深度,30万半导体精英关注!专注观察全球半导体最新资讯、技术前沿、发展趋势。

产业神经网络深度学习摩尔定律Mythic
1
相关数据
Amazon机构

亚马逊(英语:Amazon.com Inc.,NASDAQ:AMZN)是一家总部位于美国西雅图的跨国电子商务企业,业务起始于线上书店,不久之后商品走向多元化。目前是全球最大的互联网线上零售商之一,也是美国《财富》杂志2016年评选的全球最大500家公司的排行榜中的第44名。

https://www.amazon.com/
相关技术
IBM机构

是美国一家跨国科技公司及咨询公司,总部位于纽约州阿蒙克市。IBM主要客户是政府和企业。IBM生产并销售计算机硬件及软件,并且为系统架构和网络托管提供咨询服务。截止2013年,IBM已在全球拥有12个研究实验室和大量的软件开发基地。IBM虽然是一家商业公司,但在材料、化学、物理等科学领域却也有很高的成就,利用这些学术研究为基础,发明很多产品。比较有名的IBM发明的产品包括硬盘、自动柜员机、通用产品代码、SQL、关系数据库管理系统、DRAM及沃森。

https://www.ibm.com/us-en/
相关技术
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

摩尔定律技术

摩尔定律是由英特尔创始人之一戈登·摩尔提出来的。其内容为:积体电路上可容纳的电晶体数目,约每隔两年便会增加一倍;经常被引用的“18个月”,是由英特尔首席执行官大卫·豪斯所说:预计18个月会将芯片的性能提高一倍。

推荐文章
暂无评论
暂无评论~