Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

1毫瓦芯片就能玩《毁灭战士》,超低功耗芯片来了

最近,美国人工智能芯片初创公司 Syntiant 公布了一款超低功耗芯片,可以在 1mW 的功耗下玩《毁灭战士》。

一个 1 毫瓦的机器学习芯片可以做很多事情,不过像玩《毁灭战士》(Doom)这样充满想象力的做法却很少见。

最近几日,在旧金山举行的 2023 IEEE ISSCC(International Solid State Circuits Conference)大会上,总部位于加州欧文的 AI 芯片初创公司 Syntiant 详细介绍了他们的产品  NDP200—— 一款超低功耗芯片,主要用来运行监控视频的神经网络,并在发现重要事件时唤醒其他系统。

如下为 NDP200(Neural Decision Processor)玩《毁灭战士》的演示视频片段。



如何做到的呢?

Syntiant 使用了基于 Doom 的 AI 研究平台 VizDoom,这在 AI 研究中很受欢迎。团队使用强化学习来训练多层神经网络,其中第一层负责理解网络看到的内容,而最后一层负责采取响应行动。总的来说,这个网络由大约 60 万个参数组成。虽然没有 ChatGPT 所需的亿级规模参数,但仍然要比监听「OK, Google」这类关键短语所需的 10000 个参数强大得多。NDP200 有 640 kilobytes 的板载内存用于神经网络参数

图源:https://www.syntiant.com/ndp200

如上展示的片段中的游戏关卡叫做「保卫圆圈」,它让玩家在一个圆形房间内移动,射击面前的怪物。IEEE Fellow、前 Syntiant 高级工程师副总裁 David Garrett 表示,在训练中,神经网络必须首先识别怪物,然后学习射击它们。在第一次杀死猎物后,系统会卸载 clip(可以理解为一种文件类型),但后来发现这不是一个好办法。因此,系统很快就学会了节省弹药。

尽管《毁灭战士》的演示非常精彩,但 NDP200 还有更多实际用途。Garrett 指出,它有能力进行人体轮廓检测,这是一项通常由更强大的处理器完成的关键任务。Syntiant 芯片可以运行人体检测,作为家庭或汽车安全系统的节能步骤。

为了展示其能源效率,Syntiant 将 NDP200 与基于 Arm Cortex A53 的处理器进行了比较,该处理器运行了 20 万个参数版本的 MobileNetV1,这是 MLPerf 用来判断系统对视觉唤醒词响应情况的测试。NDP200 每次扫描图像只使用 166 微焦耳,大约是 Arm 处理器的 1/100。因此,Syntiant 芯片每秒可以扫描 6 帧视频,而耗电量为 1 毫瓦。

这款芯片并没有那么神秘,它有一条定制的路径,数据在芯片的神经决策处理器中流动。据 Garett 介绍,它尽可能充分利用了芯片的乘法累加单元,即机器学习计算的核心,将高达每秒 9 gigabytes 的数据带宽传输到神经核心。

Garrett 不愿透露 Syntiant 下一步的技术发展,但他表示会有更多有趣的应用。他说:50 万个参数足够做出真正的好东西了。

原文链接:https://spectrum.ieee.org/syntiant-chip-plays-doom
入门
相关数据
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

推荐文章
暂无评论
暂无评论~