产业资讯方案大厅机构大厅

适用于盲人的环境状态识别 APP · Seeing AI

语音合成计算机视觉微软

产品描述

该 APP 通过手机摄像头配合图像识别技术以及语音合成技术,向盲人大声朗读周围的情况。其能识别摄像头中人物的身份,甚至辨识出表情和心情,能够告知用户周围的人是否在认真聆听,以及听众的其它反应。同时还能够读取反复出现的人的身份,也能对陌生人从性别、穿着、动作、状态等方面加以描述。 这款应用还能识别地名、门牌号码和其他物品,并读取名称。由于其首发地在美国,所以 APP 还具有分辨美元面值的能力。 并可为盲人朗读文件,通过手机拍照功能识别文件,且在拍照过程中能够引导使用者将文件的全部内容锁定到取景框内。例如,应用会提示用户「向右下角移动手机,并且将手机远离文件一点」,为盲人点餐提供极大便利。

所用技术

研发机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。