AI向主动感知迈进,亮亮视野与中科院成立“第一视角计算联合实验室”

9月12日,AR领军企业亮亮视野与中科院自动化所联合宣布,双方将一同合作,成立“第一视角计算联合实验室”。同时举办“首届第一视角智能交互高峰论坛”,多位人工智能领域专家学者和产业界人士就第一视角“智能感知交互的未来”进行主题研讨。

据了解,中科院自动化所和亮亮视野成立联合实验室,将聚焦第一视角计算前沿课题的研究和成果落地。研究视觉智能感知技术,涵盖目标检测、人脸识别和场景识别等;研究深度神经网络压缩和加速技术,并落地到亮亮视野实际业务中使用。这种前沿研究与商业场景的结合,对于人工智能商用发展来说,价值巨大。

中科院自动化所徐常胜研究员表示,在国内AR领域,近两年亮亮视野成绩斐然,是国内第一家专注于将AI赋能到智能眼镜上的研发企业,并且积累了扎实的科研技术。双方成立“第一视角计算联合实验室”,将形成在智能眼镜领域科研、人才培养和社会服务的联合优势,推动智能可穿戴设备科技进步和产业提质升级。

亮亮视野创始人吴斐则表示,亮亮视野自成立之初,就致力于将企业自身与学术研究机构进行产学研的结合。亮亮视野在第一视角交互上的技术和商业探索,产生了很多主动感知的数据和场景落地,与中科院自动化所成立“第一视角计算联合实验室”,是在AI发展风口时研发与技术落地上的强强联手,通过科研合作,不但有望实现前沿技术的突破,还将尽快推动行业落地。在第一视角产业领域,亮亮视野走到了世界前沿,在接下来的产业突破中,尤其在第一视角计算,需要更紧密的和类似自动化所这样全球顶尖AI科研机构共同推动创新,以保持在全球的领先。为行业注入新的发展动力。

此次中科院自动化所-亮亮视野“第一视角联合实验室”主办的“第一视角智能交互高峰论坛”,旨在推动第一视角交互计算的发展,推动AI商业落地,为行业发展贡献智慧和动力。

第一视角计算让被动感知走向主动感知

人类在观察世界的时候,都是自主的通过眼睛来观察,这便是经常所说的第一视角。AI长期以来受益于被动感知的快速发展,在安防的场景中来说,第一视角较传统的第三视角的优势仍尤为明显,即使有AI能力加持,固定视角目前仍只能是被动感知。“第一视角”天生具备无法比拟的获取数据与知识的潜能,以其为代表的智能眼镜,在感知的基础上引入了人的因素,对未来的AI发展打开了新的局面。

第一视角主动感知,更多的是对人的能力的增强而不是替代。如在安防场景中,警察用智能眼镜主动对其怀疑有问题的车辆进行车牌识别查询,就是对人与机器交互能力的一个增强。同时通过了第一视角结构化的知识标签,人的智能可以反过来再增强AI,形成感知闭环。

第一视角的感知,对计算提出了一个超高的要求,即对现实感知的超高实时性,而AI芯片的边缘计算是目前最好的解决方案之一。它克服了传统的云端计算方案容易造成网络延迟的问题,且对云端服务器并发能力更大的释放,用户体验和商业应用提升了一个新的高度。 

第一视角计算从技术积累到商业落地

被动感知的固定摄像头在安全监控领域已取得巨大的社会价值和商业价值,亮亮视野则借助第一视角计算引入了移动安防概念,做出了行业突破。今年初,郑州铁路东站警方在全国铁路系统中率先使用具有人像比对的亮亮视野移动警务眼镜。查获涉嫌拐卖人口、交通肇事逃逸等重大刑事案件的网上在逃人员7名,以及冒用他人身份证件的人员26名。

亮亮视野是首个将智能识别技术应用于智能眼镜的AR公司,其产品搭载Movidius Myriad 2 芯片,具备强大的边缘计算能力,可在前端就进行实时的人脸、车牌的采集和识别。目前,亮亮视野是唯一一家采用边缘计算制定移动安防解决方案的AR公司。

工业场景中,亮亮视野已经与华为、必维等头部公司达成合作,在合作中发现,通过第一视角感知带来的语音、视频交互可以生产标签数据。“这样的标签数据累积起来,通过深度学习训练,反过来又可以帮助智能眼镜提升第一视角感知能力。”中科院自动化所董未名研究员说道。当前,亮亮视野与华为合作,推出 eView 智能装备,提供第一视角实时视频交互,实现了知识赋能;亮亮视野与必维国际合作,将全球6万多名员工与后台专家连接,提升工作水平;神州高铁与亮亮视野合作,将AR与图像识别技术应用于高铁远程运维、线路巡检、预测性维修等多个方面。

亮亮视野发布Laffe计算库

中科院自动化所-亮亮视野“第一视角计算联合实验室”成立之际,亮亮视野发布了第一视角计算基础库Laffe。 “我们今天发布的Laffe,它是一个第一视角计算的基础库,在VPU/NPU上,对卷积神经网络推理计算能力进行了深度优化,部分算子的计算速度提升了1倍到10倍不等,可以支持各种主流深度学习框架如Caffe/Mxnet/TensorFlow训练的模型在智能眼镜上快速部署。”亮亮视野首席AI博士姚寒星表示,“这一研发成果已经在实际生产中得到验证,我们很高兴我们的行业客户也能从中受益。它提供了真正的附加价值。”“

亮亮视野阵列光波导L-PAT亮相高峰论坛

在当天举行的高峰论坛上,亮亮视野创始人吴斐透露了亮亮视野在光学技术领域的研发成果。“第一视角产生的结果和数据需要通过可视化的手段展示,我们经过四年的探索,研发出阵列波导L-PAT, 他最大的优势就是通过薄至1.5mm的镜片将主动感知的信息实时与现实叠加,对第一视角的主动赋能扫清了显示的技术障碍。目前全球范围内,亮亮是少数几家达到高水准显示且规模量产的科技公司。”

亮亮视野联合创始人,浙江大学现代光学仪器国家重点实验室郑臻荣教授在论坛会上首次透露了亮亮视野在光学及AI跨学科的雄心:“光学不仅能用在可视化,还能用于高能效的第一视角计算。”郑臻荣说:“第一视角的交互,非常有赖于对现实大量数据的实时性处理。目前所有的方法,都是通过摄像机先成像,然后经过电子计算获得结果,这本身就是一个功耗很大的工作。要解决这个矛盾,不仅仅应该从嵌入式计算的角度来看待这个问题。光学计算与人工智能的跨学科合作将成为下一个时代的重点,而与亮亮视野的联合研发已经在人工智能光学计算上取得了重大突破”。

亮亮视野创始人吴斐说道,“亮亮视野和浙江大学光电学院、中科院自动化所合作,共同探讨OPU( optical processing unit)研发。我们将通过前端光学元器件,进行实时的、低功耗的卷积计算,大大提升算力能效比。这一研究方向在国际上也是最前端的”。


产业中科院自动化研究所增强现实亮亮视野计算机视觉创业公司
3
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

卷积神经网络技术

卷积神经网路(Convolutional Neural Network, CNN)是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。卷积神经网路由一个或多个卷积层和顶端的全连通层(对应经典的神经网路)组成,同时也包括关联权重和池化层(pooling layer)。这一结构使得卷积神经网路能够利用输入数据的二维结构。与其他深度学习结构相比,卷积神经网路在图像和语音识别方面能够给出更好的结果。这一模型也可以使用反向传播算法进行训练。相比较其他深度、前馈神经网路,卷积神经网路需要考量的参数更少,使之成为一种颇具吸引力的深度学习结构。 卷积网络是一种专门用于处理具有已知的、网格状拓扑的数据的神经网络。例如时间序列数据,它可以被认为是以一定时间间隔采样的一维网格,又如图像数据,其可以被认为是二维像素网格。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

深度神经网络技术

深度神经网络(DNN)是深度学习的一种框架,它是一种具备至少一个隐层的神经网络。与浅层神经网络类似,深度神经网络也能够为复杂非线性系统提供建模,但多出的层次为模型提供了更高的抽象层次,因而提高了模型的能力。

推荐文章
暂无评论
暂无评论~