计算机视觉借相机一双「慧眼」,复杂的运动细节也能360°无死角监测

智能手表等可穿戴式设备,深受健身运动者喜爱,款式多样的可穿戴智能设备逐渐成为一种流行的健身激励工具。这些智能设备的功能多数用来监测佩戴者的运动心率、步数、睡眠等数据,但对于健身房环境中种类多样的运动来说,可穿戴设备无法一一“感觉”到所有运动的模式

一群来自卡耐基梅隆大学(Carnegie Mellon University, CMU)的研究人员最近开发了一款固定式的“运动相机”,运动者在健身房运动时,这款“相机”便更好的监测运动细节

这项最新的发现由卡耐基梅隆大学人机交互研究所(HCII)的研究人员Rushil Khurana博士和Karan Ahuja博士主导。这款“运动相机”学名GymCam,基于计算机视觉技术(Computer Vision),它可以检测运动者重复的动作。基于GymCam捕捉到的运动信号,研究人员可以检测到健身房中人们的运动情况。此外,他们还能识别运动的类型,并精确计算运动的重复次数。

计算机视觉通常研究如何使机器学会“看”,更进一步来说,就是指用摄像机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。通常,人类的感知能力可以看作是从感官信号中提取信息,所以计算机视觉作为计算机的“眼”,便可以看作是研究如何使人工智能系统从图像或多维数据中“感知”的科学。

图片来源:Pixabay在健身房运动时,人们一般会花较长时间重复一项运动,各类手部的重复运动可以使“运动相机”能很快捕捉并学习这是什么运动;更厉害的是,当两个人或多人在一起做同样种类的运动,即使他们的动作不同步,“运动相机”还是可以区分出他们之间的运动差异。经研究人员在拥挤的大学体育馆进行的相关测试结果显示,当前版本的GymCam在区分人们的运动动作差异的准确率达到84.6%

研究人员表示,GymCam对运动者的运动信息的依赖同时也解决了健身房拥挤环境中单个摄像头系统无法看到整个身体的问题。使用单个摄像头系统时,健身器材以及其他人会成为“扰乱”相机视野的因素,但是GymCam独具“慧眼”不会被这些外在因素模糊视野,一旦它看到运动者任何身体部位重复运动,它就能检测到运动状态。

图片来源:Pixabay现在市面上最常见的智能手表和其他可穿戴设备在追踪监测有氧运动和一些力量训练运动方面表现很好,但这些智能设备所发挥的效果取决于佩戴者的使用地点,比如,在举哑铃时佩戴智能手表,无法感知腿部的运动情况。此外,手表较难区分肢体动作具体是什么。

这款“运动相机”除了可以识别人们的运动情况,还可以通过识别健身房里不同类型的健身器材特征及位置,来确定人们正在做什么运动。接着,结合相机所捕捉到的人的运动情况、所处位置,GymCam也可以来确定他们正在做的是什么运动。根据测试,GymCam确认人们正在进行的运动准确率为93.6%

图片来源:Pixabay最近,由于“AI换脸”技术带来的负面影响,人们不禁会有这样一个疑问:这款运动相机能保证我的脸不用于其他途径吗?CMU研究人员为此解答,GymCam的目的是为了捕捉运动信息,因此安装在健身房或者公共场所的摄像机的输入图片的像素会降低,并会消除可能侵犯隐私的可识别的人脸图像。人们无需担心GymCam会侵犯隐私的问题。

研究人员表示,基于计算机视觉的GymCam不会仅仅用于健身房来作为辅助人类运动的作用,除了体育锻炼,该系统还有其他用途。在保证个人隐私的前提下,当该摄像系统与个人佩戴的智能手表相结合时,有望帮助视力有障碍的人在购物中心、机场等公共场所实现可视导航

药明康德AI整理编译

题图来源:Pixabay

参考资料

[1]GymCam Tracks Exercises That Wearable Monitors Can'tRetrieved Sep 24, 2019 from https://www.cs.cmu.edu/news/gymcam-tracks-exercises-wearable-monitors-cant
药明康德AI
药明康德AI

药明康德微信团队专业打造。当人工智能遇上大健康,带你看全AI时代的智慧之光。

专栏二维码
产业计算机视觉
相关数据
感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

机器视觉技术

机器视觉(Machine Vision,MV)是一种为自动化检测、过程控制和机器人导航等应用提供基于图像的自动检测和分析的技术和方法,通常用于工业领域。

推荐文章
暂无评论
暂无评论~