Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

千元级AI 模盒,云天励飞率先打响大模型「平民化」之战

从 Gemini、Lumiere、再到 Sora,“百模大战” 的 “战火” 延续至 2024 年。诸多的大模型已经诞生,接下来的任务是落地。但行业大模型在落地过程中,遇到的瓶颈就像是一座冰山,藏在冰山下面的问题,更加棘手。

要做物理世界的解码者,为 “无形” 技术和 “有形” 世界构建通道,这是云天励飞的定位。如何构建 AI 落地的通道?2024 年,围绕 “自进化城市智能体” 的理念,云天励飞持续深耕 AI 市场,并且在 3 月发布 “深目” AI 模盒,为 AI 大模型落地长尾场景交上一份新答卷。

AI 落地关键期

如何走出长尾场景算法难题

一般来说,AI 行业有着三大发展阶段,分别是技术找场景、场景反哺技术、场景找技术。

图片

第一阶段在 2012 年到 2022 年间,基础技术与感知智能迎来突破,AI 算法在人脸识别、智能驾驶、语音识别等应用场景中实现价值验证。在这个过程中,云天励飞率先入局,2016 年,云天励飞研发的全球首套动态人像识别系统云天 “深目” 在深圳上线,通过城市级大规模人像信息搜索、布控和数据挖掘能力,实现 “亿万人脸、秒级定位”,也由此揭开了整个智能安防千亿市场的大门。

到了第二个阶段大量场景的需求和数据反哺技术迭代。在芯片方面,从 2016 年至今,云天励飞的 AI 芯片已经演进了 4 代,新一代 DeepEdge10 融入 NNP400,是一颗 14nm Chiplet 大模型推理芯片。通过芯片的迭代,云天励飞让百亿级、几十亿规模的大模型可以运算在轻量级的边缘芯片上,完成高效推理。

在大模型方面,2023 年,云天励飞推出自研大模型 “云天天书”,经历 3 代,已经更新至 3.5V 版本,增加了多模态支持,今年 6 月份将升级到 4.0V 版本。云天励飞通过算法、算力、数据这 “三驾马车” 驱动大模型,助力多行业应用落地。

第三阶段场景找技术预计会在 2027 年到 2030 年间到来,届时将初步实现 AGI 与全面智能化,不同的行业、场景需求都会得到相应的解决思路和方案。

在 AI 发展不同的阶段,云天励飞的布局始终围绕核心能力 —— 算法芯片化,从神经网络处理器及推理芯片,再到多模态大模型,云天励飞坚持用算法芯片化赋能边缘在线学习

2024 年,AI 行业迈向下一个阶段,此时处于第一、第二阶段转换的关键时期,这个阶段长尾场景算法带来的问题不容忽视。

长尾场景指的是火灾等低频事件、更细分、更复杂的场景,极端场景识别训练的数据几乎为 “0”,需要高昂的算法成本,但商业价值并不明显。业内人士将其称为冰山之下的 “死亡之谷”。特别是在智慧城市、交通管理等应用场景,需要解决算法训练成本高、缺乏训练数据等痛点。

该如何走出死亡之谷,杀出另一条生路?

云天励飞副总裁罗忆回忆,云天励飞一直寻找解决方案,解决长尾场景的海量需求,包括升级算法训练平台,降低算法生产成本,提升算法生产效率;打造算法开放平台,与行业伙伴共同丰富算法集市;开源 AI 大模型生产平台 YMIR,让客户能低成本地训练算法,并应用在芯片上面。

罗忆坦言,云天励飞在努力提高效率,但效果并不明显。直到 2022 年,基于 Transformer 架构的生成式预训练大模型技术的出现,让 AI 行业看到了 AGI 的曙光。算法在经过大量数据喂养之后,大模型表现出来了极强的学习能力、场景泛化能力,也验证了云天励飞坚持的 “自进化城市智能体” 理念的可行性。云天励飞认为强大数据输入是大模型场景覆盖广的核心。

图片

千元级 “深目” AI 模盒实现大模型 “平民化”

随着市场需求的提升,大模型的应用从成熟场景走向新场景、多任务场景,但在应用过程中发现常规推理盒子在新场景中 POC 周期长达 2 至 3 个月,特定场景需在本地增设训练服务器;面向多任务场景任务数量与算力需求呈线性增长。若要训练专属大模型,企业需要应对不断上涨的成本。

为了补足长尾场景算法市场空白,云天励飞在今年 3 月发布了 “深目” AI 模盒,设计小巧,单手可托起。一个看似小小的盒子,“功力” 却不简单。

图片

一是 “深目” AI 模盒做到 “3 个 90%”—— 覆盖场景超过 90%、算法精度超过 90%、使用成本降低 90%,解决大模型在场景落地最后一公里的问题。

二是把大模型应用成本降到千元级别。常规大模型一次训练成本在千万级,主流的训推一体机价格普遍在百万元。但云天励飞将 “深目” AI 模盒的售价做到了千元级,让每个企业都拥有专属大模型。

三是 “深目” AI 模盒可承载 10 亿级 SAM、百亿级 Llama2 等大模型运算,适用于 AIoT 边缘视频、移动机器人等场景。

罗忆介绍,面向新场景,“深目” AI 模盒 POC 降至 1 至 2 周,并且训练推理一体化;面向多任务场景,越多任务并行算力高效性越凸显。值得一提的是,“深目” AI 模盒将算法生产从 7 步缩短至 4 步,算法调优从 7 步缩短至 3 步。

为了能够让 “深目” AI 模盒实现以上创新,云天励飞进行了大量的技术攻关。在算力上,“深目” AI 模盒搭载了云天励飞新一代 14nm Chiplet 大模型训推芯片 DeepEdge10 Max,采用 RISC-V 核,配备了 D2D Chiplet 架构打造的推理卡。

在算法上,以多模态大模型 “云天天书” 为底座,该大模型具备泛化和学习的能力,客户部署算法后,大模型还能够不断根据现实应用场景情况,自我迭代,不断提升算法精度。

亿欧智库的数据显示,截至目前,国内公布的大模型数量已超过 300 个。云天励飞的 “云天天书” 在众多大模型中脱颖而出,获得中央网信办备案,在 C-Eval、CMMLU 多次获得第一,并且落地政务、交通、企业等多个领域。

在 AI 浪潮中,几乎所有的企业都在寻求入局机会,而早已在 AI 市场深耕的云天励飞,有着深厚的 AI 基因,可以说这波 AI 浪潮,将它的 AI 技术积累,发挥出了最大价值。“深目” AI 模盒的出现,让云天励飞实现了大模型 “平民化”,AI 普惠化的进程也将由此加快。

进军硬件领域

2024 年加速推进 AI 产品化

董事长兼 CEO 陈宁博士表示,AI 商业化发展有三个阶段:AI 方案化、AI 运营化、AI 产品化。这也是云天励飞的业务发展路径。图片

在 AI 方案化方面,云天励飞已经在警务、城市治理、智慧交通、人居生活等领域打造出了成熟行业解决方案,并且持续探索低空经济、智慧教育等创新领域。基于在大量行业的落地经验,云天励飞逐渐实现 AI 运营化,随着 “深目” AI 模盒的发布加速走向 AI 产品化。

事实上,云天励飞早在 2023 年就推出了内置云天天书大模型的产品,与华为昇腾联合推出的天舟大模型训推一体机,可满足面向多业务场的大模型高并发高能效处理、业务快速上线的需求。

云天励飞认为人工智能将快速进入到标准化产品的时代,因此公司加速推动在终端边缘、云端智能硬件的 AI 产品的标准化。尽管 2024 年才过去一个季度,但云天励飞的动作却不少。3 月,云天励飞于与智慧互通(IICT)签署战略合作协议,双方将共同推动 AI 在智慧交通和数字城市等领域的深度融合与落地。

除了已经沉淀多年的智慧城市、智慧安防、智慧交通等领域,云天励飞还在持续开拓新的领域。同样是在 3 月,云天励飞收购了智能穿戴方案设计头部公司岍丞技术。在完成收购之后,云天励飞将进一步整合岍丞技术在智能穿戴上的能力,开展智能穿戴产品的软硬件开发与技术服务业务,探索 “大模型 + 智能可穿戴” 深度融合,推进大模型语音交互落地。

陈宁博士预判,未来 AI 大模型一定会走向 C 端,包括 AIPC、AI 手机,甚至走向可穿戴设备,引爆可穿戴设备新一轮变革,最终会通过 AR/VR、AI Pin 等面向 C 端的可穿戴设备让每个人都拥有一个 AI Agent。

毫无疑问,今年会是云天励飞 AI 产业化布局加速的一年,不管是技术迭代,还是 AI 落地,在 “百模大战” 的大模型落地竞速赛中,云天励飞将围绕算法芯片化技术能力,打造出新的技术底座,并赋能到千行百业中,AI 普惠化、大模型 “平民化” 将是下一阶段的关键词。

产业“深目” AI 模盒云天励飞
相关数据
华为机构

华为创立于1987年,是全球领先的ICT(信息与通信)基础设施和智能终端提供商。

https://www.huawei.com/cn/
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

提升算法技术

Boosting是一种主要用于减少偏差的机器学习集成元算法,也是监督学习的一个变化,是一种将弱学习器转换为强学习器的机器学习算法家族。 Boosting是基于Kearns和Valiant(1988,1989)提出的问题:一组弱学习器能创造一个强大的学习器吗?一个弱的学习器被定义为一个分类器,它与真实的分类只有轻微的相关性(它可以比随机猜测更好地标注示例)。相反,强大的学习器是一个与真实分类任意相关的分类器。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

在线学习技术

在计算机科学中,在线学习是一种机器学习方法。和立即对整个训练数据集进行学习的批处理学习技术相反,在线学习的数据按顺序可用,并在每个步骤使用未来数据更新最佳预测器。

移动机器人技术

移动机器人是一种能够移动的自动机器。移动机器人具有在其环境中移动的能力,并且不固定到一个物理位置。移动机器人可以“自动”主要是指它们能够在没有物理或机电引导装置的情况下导航非受控环境。相比之下,传统的工业机器人或多或少都是固定的(stationary)机械臂或抓取组件。

云天励飞机构

深圳云天励飞技术有限公司成立于2014年8月,致力于通过AI技术进行物理世界的结构化,打造数字孪生城市。公司依托一流的国际化专家团队和“全栈式”AI技术平台,打造了面向公共安全、城市治理、新商业等领域的产品和解决方案,以深圳先行示范区-粤港澳大湾区的双区驱动为基点,以青岛、成都、长沙、南京、杭州、上海、北京等城市为灯塔,业务辐射国内外100多个城市。

www.intellif.com
场景识别技术

场景识别是一类很常见的图像处理任务。就是给一张地标图像,快速准确地识别出这张图像的场景,识别的结果既可以是具体的地理位置,也可以是该场景的名称,还可以是数据库中的某个同样的场景。

推荐文章
暂无评论
暂无评论~