Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

看得见的声音!亮亮视野助力听障人士与世界“对话”

“助力无障碍沟通,让无声世界同样精彩。”想象一下,听障人士遇到不会手语的普通人,只要戴上眼镜就能欢笑言谈,这可能就是他们最小小的心愿。为了让听障人士拥有更好的生活品质,去拥抱梦想,近日,亮亮视野针对听障人士打造能够实时语音转文字的AR透明光波导眼镜,致力于用AR+AI为听障人群搭建无障碍沟通平台。

看见“声音”,打破沟通断层

随着人工智能的发展,语音转文字已经极为常见和重要,但是这一技术仍有不少难点需要突破,其中之一就是转换效率,如果文字能随着声音实时呈现,那就意味着,当双方交流的时候,效率会更高。再如果文字能直接呈现在眼前,沟通就可以像面对面交流一样自然。

为此,AR透明光波导眼镜以“影院级字幕体验”为追求最终应需而生。该产品内置强大的实时智能同传引擎,用前沿的神经网络机器翻译技术进行模型训练,让语音识别、自动断句和机器翻译等表现的更加优异,搭配算力强悍的AI处理芯片,尽可能接近“音字同步”的效果。

也正是得益于这一技术,AR透明光波导眼镜还可以用来看无字幕的视频、电影、演讲等内容,帮助听障人士更好融入社会,更好享受数字化生活。

此外,为了给听障人士带去更多便利。该眼镜app除了支持对话模式外,还加入了会议模式和ORC模式。开启会议模式,可以进行多人交流,也可以远程进行PPT的汇报或宣讲,其提供的会议平台可以保障客户的隐私。OCR模式可以一声令下对拍照画面上的文字进行实时翻译,不论是阅读外文资料还是出国旅游,都十分的实用。

此外,所有模式下,转换的文字信息都可以记录在手机中。用于教学上,可以帮助学生一边观看老师的授课画面和课件内容,一边结合字幕理解,课后通过文字记录进行复习,从而更好的理解知识点,也保障了教学工作的正常运转。

亮亮视野产品负责人表示,“该AR眼镜配备清晰、通透的阵列光波导光学模组,即便在阳光下,文字也可以清楚显示。此外,其具备3米内完整收音的效果。确保了良好的交流体验”。


AI上交流,致力帮助听障人士解决生活问题

据世界卫生组织估计,目前中重度听损人士已超过4亿。到2050年,预计全球有四分之一的人口会存在听力问题。其中,11亿年轻人,将因不良聆听习惯而处于永久听力损失的危险中。而我国是世界上听力残疾人数最多的国家,据第二次全国残疾人抽样调查数据显示,我国的听力残疾人约2780万人。“由于残障特征不明显,听障人群缺乏关注,信息无障碍基础设施缺失,他们欠缺有效沟通交流、学习提升的机会和通道,工作、学习的天花板尤为明显。” 中国聋协主席杨洋表示。

“我们希望将计算机视觉、人工智能技术用于辅助听障人士,在教育中,提高教育质量,解决无法学习的问题;在就业中,消除就业障碍,打开更优质岗位以及岗位晋升的道路;在社会上,拉近听障人群因言语障碍带来的距离,消除沟通隔阂,完善听障人士的无障碍建设,帮助解决公共服务中听障专业人士短缺的社会痛点。” 亮亮视野创始人兼CEO吴斐介绍称。

持续进化,实现AR普惠

但吴斐也坦言,AR透明光波导眼镜是很好的服务形态,但做到优秀还有许多工作需要做,现在仍处于实际应用探索阶段。主要有三个问题,一是复杂环境背景的适应性,二是语料库进一步拓展,三是双向沟通充分打通。为更好的服务听障人群,双方将分以下几个阶段对产品进行升级和优化:

一,依托自身在工业领域的资源优势,服务企业日常会议工作,服务工程师跨国交流,进而丰满语料库,提升使用体验;

二,进一步深入接触听障群体,了解各类听障人士的需求,优化识别算法,提供除交流以外的更多使用场景;

三,引入手语识别、助听技术等,帮助中老年听障人群更自然的接受新鲜事物。

谈及初衷,吴斐表示,“我们希望能够进一步开发出小而美的场景应用,从简单的场景方案出发,形成标准产品及方案,来让更多的用户能够感受到AR的场景和能力,最终为了实现‘普惠AR’的远景目标,找到AR应用领域的最佳实践 “。

产业图像识别AR
暂无评论
暂无评论~