200帧高速采集,INDEMIND双目视觉惯性模组助力立体视觉应用升级

近年来,机器人、深度学习、姿态检测、自动驾驶等前沿领域的高速发展为计算机视觉领域拓展了巨大增量,创造了新的千亿级市场,与此同时,这些不断高速发展的“推手”也对计算机视觉提出了新的需求,开始倒逼计算机视觉技术升级进步。

近年来,机器人、深度学习、姿态检测、自动驾驶等前沿领域的高速发展为计算机视觉领域拓展了巨大增量,创造了新的千亿级市场,与此同时,这些不断高速发展的“推手”也对计算机视觉提出了新的需求,开始倒逼计算机视觉技术升级进步。

深耕不辍,实现业内首款200帧双目惯性相机

面对日益提升的使用需求,为提升产品适用性,INDEMIND深耕不辍,为旗下双目视觉惯性模组提供了200帧高速环境获取能力,满足了不同场景的使用需求。

双目视觉惯性模组是目前业界首款可连续输出200帧图像及IMU数据的双目惯性相机,用户可自行调节1280*800分辨率下25/50/100FPS、640*400分辨率下25/50/100/200FPS不同图像输出,可为三维重建、深度解算、视觉SLAM等应用研发提供更精准、丰富的环境图像信息。

众所周知,自动驾驶、姿态检测等场景非常依赖双目立体相机采集图像、位姿信息的清晰度、丰富度,单位时间内双目相机提供的信息越多,越有利于相关场景的算法追踪及定位,降低算法开发难度。

采集丰富人体姿态信息,赋能动作捕捉

引用自《openpose》

以动作捕捉为例,在影视创作、VR虚拟人物等应用场景,姿态检测是其工业领域不可或缺的一环。但传统姿态检测技术需要在被捕捉物体的身上标记诸多光学标记,并且需要至少两个以上的传感器来采集被捕捉物体的运动信息及惯性信息,捕捉过程极为复杂和漫长,并需要对捕捉过程中产生的大量数据进行后期处理,才能实现近乎真实的动作捕捉三维模型重建。而随着INDEMIND双目视觉惯性模组采集帧率的突破,在精确度及采集速度上取得了大幅提升,呈现出了更精细及更具动作连续性的姿态检测效果,这也意味着单位时间内,双目惯性模组可采集更丰富的人体姿态信息,为后期算法处理,提供更多数据。

高速采集路况信息,实现高速机动自动驾驶

更值得一提的是,视觉作为自动驾驶系统的重要环境感知入口,是其重要核心组成部分。在自动驾驶系统中,计算机视觉着重负责提供环境感知,如路况检测、指示标牌识别、车道检测等一些列环境识别、感知。在这一工作进程中,信息收集、算法处理、结果输出等三大环节在以往的自动驾驶中,由于视觉传感器的限制,无法快速收集并反馈环境信息,使得视觉在整个系统中的无法凸显其关键作用。

以车道检测为例,在车道检测环节中,视觉需对道路弯曲、阴影、路面变化、标识线变化等路况实时反馈分析,并通过深度学习算法,自动生成车辆最佳行驶路线。而想要实现快速机动反应,便需要高速的环境采集能力,INDEMIND双目视觉惯性模组的图像采集帧率可达到200帧,在遇到车道变化时,双目视觉惯性模组可以0.005秒/帧的速度快速检测车道变化,并通过连续多帧分析车道变化趋势,为自动驾驶算法提供多方面精准、快速的环境信息数据,辅助算法实现高机动自动驾驶。

除了上面说的例子,双目视觉惯性模组帧率提升至200帧的背后,意味着环境信息采集能力的巨大提升,还可在环境感知、三维识别、深度解算、三维建图等诸多应用领域发挥更多、更深层次的作用,极大推进计算机视觉技术向相关领域的扩展。

INDEMIND
INDEMIND

专注于计算机视觉及嵌入式感知计算平台研发与应用,机器人时代已来,INDEMIND将赋予机器人更稳定的视觉感知,分享最新技术,深层次探讨机器人的更多应用!

产业自动驾驶INDEMIND
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

自动驾驶技术技术

从 20 世纪 80 年代首次成功演示以来(Dickmanns & Mysliwetz (1992); Dickmanns & Graefe (1988); Thorpe et al. (1988)),自动驾驶汽车领域已经取得了巨大进展。尽管有了这些进展,但在任意复杂环境中实现完全自动驾驶导航仍被认为还需要数十年的发展。原因有两个:首先,在复杂的动态环境中运行的自动驾驶系统需要人工智能归纳不可预测的情境,从而进行实时推论。第二,信息性决策需要准确的感知,目前大部分已有的计算机视觉系统有一定的错误率,这是自动驾驶导航所无法接受的。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

百度机构

百度(纳斯达克:BIDU),全球最大的中文搜索引擎、最大的中文网站。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术,于 2000年1月1日在中关村创建了百度公司。 “百度”二字,来自于八百年前南宋词人辛弃疾的一句词:众里寻他千百度。这句话描述了词人对理想的执着追求。 百度拥有数万名研发工程师,这是中国乃至全球最为优秀的技术团队。这支队伍掌握着世界上最为先进的搜索引擎技术,使百度成为中国掌握世界尖端科学核心技术的中国高科技企业,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

http://home.baidu.com/
推荐文章
暂无评论
暂无评论~