ZoeY、蒋宝尚作者

隔空控物?谷歌这款“掌上雷达”让你用手势控制手机

还记得打个响指就把房间变成撩妹粉的日本技术宅小哥吗?这个项目可不止撩妹这么简单,至少谷歌认为,这种“手势指令”技术应该是未来人机互动的重要方向。

比如,只需搓一下手指就可以打电话;查看地图的时候,仅需打个响指;隔空调节音量...... 未来你需要的所有电子设备操作,根本无需实体键就可实现。

是不是很神奇!这些技术似乎只有在电影里才能看到~~

但是,谷歌最近的一项突破让我们朝着这个方向更近了一步!

在12月31日,美国联邦通信委员会(FCC)通过了谷歌调整后的Soli计划(Project Soli)。

Soli计划是谷歌ATAP部门在2015年提出的,运用微型雷达(Soli传感器)实现的新型传感技术。该技术目的在于设计非触摸用户界面,使用户通过雷达控制电子设备。例如,将Soli微型雷达置于智能手机中,用户通过手势实现诸如音量、频道等各种操作。

谷歌公司介绍说:“想象一下,在你的拇指和食指之间有一个看不见的按钮,你将两根手指轻触,就可以按压这个按钮。”

“你可以摩擦拇指和食指来拨动一个虚拟拨号盘。或者,想象一下你可以移动一个在空中的虚拟滑块。”

神奇吧!这就是谷歌正在开发和设想的各种互动模式~

据了解,在2016年谷歌I/O大会上,谷歌曾在智能手表上演示了其Soli技术的强大功能。通过手势,用户可以发出按键、滑动指令。

技术进展一波三折

不用实体接触就能实现系统运行,相比目前常见的语音识别更困难,毕竟,手势识别不像语音识别那样容易实现。

谷歌很早之前就已经尝试过手势控制技术,2013年他们曾与汽车制造商福特合作,开发出了用手势打开和关闭车窗以及控制空调的技术。

谷歌的Soli计划其实并非一直顺风顺水。除了技术上的难点,还存在不少政策问题。

今年3月份,谷歌要求FCC允许其Soli传感器在符合欧洲电信标准协会的功率水平标准下工作(57至64GHz频段)。随后Facebook表示,谷歌技术使用的高功率水平可能会干扰现有技术。

在谷歌将功率水平降低到美国监管机构的要求后,两大巨头在9月份达成了协议。

据路透社抢先报道的免责声明指出,Soli项目承诺“将最小化造成有害干扰的可能性”,并指出该项目是为了公共利益。

拖了几个月后,在12月31日,美国联邦通信委员会(FCC)通过了谷歌调整后的Soli计划。

工作原理

来自五个用户分别作出的四个手势的传感器数据

这项技术的工作原理是发射一束雷达光束,这样就可以在三维空间中跟踪手的运动。

当然,这也需要特殊设计的雷达传感器,因为他的准确度必须要求可以追踪亚毫米精准度的高速运动。

有了雷达信号之后,通过对手指运动的捕捉,分析反射信号在时间上的动态变化,识别成一系列通用的交互手势,方便控制各种可穿戴和微型设备。

虽然这些动作都不经过实体操作,但是因为是多个手指之间的相互动作,从而可以给用户很好的触觉感应和物理反馈。因为人类有精准的小肌肉运动技能(fine motor skills),它可以让这些虚拟工具通过我们手势运动实现很高的流畅性和精准度。

Soli传感器能带来什么

专家告诉《每日电讯报》,手势指令技术可以在人工智能的帮助下得到训练,这样智能设备就能够识别出一个人的手势并执行指令。

拉夫堡大学高级VR研究主任Roy Kalawsky表示,手势指令对于那些无法使用电脑键盘或智能手机的人们来说将是一个“福音”,这让他们有机会接触到更多科技技术。

他说:“训练一个系统将一些手势转换成对计算机系统有意义的命令是可行的。这打开了将更多技术集成在一起的大门。”

伦敦帝国理工学院计算机视觉和学习实验室的负责人Tae-Kyun Kim博士说,这项技术代表着“巨大的技术突破潜力,我们可以把这项技术应用到任何机器和机器人身上,这样在远程或虚拟环境中我们就可以像使用自己的手一样灵巧方便。”

除了Google,苹果和微软也一直致力于相关技术的研发。微软从 2014 年起就开始积累可穿戴手势识别技术。例如在 2015 年,微软曾申请了一项智能戒指相关的专利,其内置深度传感器,能感应到手指的动作,可以与智能手表搭配使用,通过手势操控的方式来向智能手表传达指令。

而 Google 本身已在手势识别传感技术上积累多年,将其应用在 Android Wear 上也不会是一件很难的事。其根本还是在于消费者的需求,对于智能手表、手环、戒指一类的可穿戴产品来说,是否真的对手势识别这一技术有足够的需求。

相关报道:

https://www.telegraph.co.uk/technology/2019/01/02/google-sensors-control-phone-wave-hand/

https://baijiahao.baidu.com/s?id=1621622913820205646&wfr=spider&for=pc

https://www.jianshu.com/p/8f9aa1e9378a

大数据文摘
大数据文摘

秉承“普及数据思维,传播数据文化,助⼒产业发展”的企业⽂化,我们专注于数据领域的资讯、案例、技术,形成了“媒体+教育+⼈才服务”的良性⽣态,致⼒于打造精准数据科学社区。

产业人机交互可穿戴设备Project Soli智能手机
1
相关数据
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

推荐文章
暂无评论
暂无评论~