Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱原创

他们用AI,让大山里的孩子也能「说好」普通话

他们用 AI 帮助千千万万个「丁真」学习普通话,走出大山,走向更好的未来。

「我的家在四川甘孜州理塘县,就住在格聂雪山脚下。在我们村庄,每天推开门就能看见格聂雪山。这就是我的世界……」
 
伴随着「丁真」的名字火遍全国,理塘也越来越为人所熟知。

图片来源:理塘县人民政府

雪山、草原、冰川、寺庙、白塔…… 这里有着如画的风景,无愧于它「天空之城」的称号。但受制于交通、地理、海拔等因素,不少生活在山区的儿童仍然缺乏与外界的连接。部分地区的素养教育资源分配不均匀,且网络信息良莠不齐,很多山区儿童缺乏良好的学习普通话的条件。
 
普通话对于下一代的教育尤为重要。听得懂普通话,才有机会学习到更多的知识,也能带动更多当地大人说普通话,从而达到 “小手拉大手” 的目的。

那么,如何帮助山区儿童学习课外知识、提高普通话水平?如何为他们提供素养提升的正规渠道?在近日落幕的第二届腾讯 Light・公益创新挑战赛上,一款名为「语言海洋泡泡」的获奖作品,吸引了不少人的目光。

在「泡泡」里学习普通话

「对于我们来说,讲普通话是一件很简单的事情,毕竟我们从小在城市中长大,接受的教育都是以普通话进行的。但是在山区和更偏远的地方,孩子们用来交流的是他们的方言,学习普通话的氛围是不足的。」在决赛路演中,北辰之星团队成员分享了自己的感悟。

北辰之星团队的成员来自国内外的几所高校。这些年轻人中,年龄最大的只有 24 岁,此外还包括两位 00 后成员。虽然身处不同的地区,但他们在读书期间都参加过一些关于普通话推广的公益项目。

也是这些社会实践给了他们一些启发。在一次面向理塘当地的调研中,一位团队成员曾在藏民家中与其家庭成员进行交谈,他观察到,接受普通话教育的年龄阶段、环境,对一个人学习普通话的水平具备关键影响。

「藏民家有三个女儿,年龄最小的女儿普通话说得最流利,也是最喜欢说普通话的。在藏区,青壮年说普通话的人数要比老年人的人数更多。」

但在一些偏远的地区,小朋友要想获得充分的基础普通话学习渠道极其不易。

假如以小游戏的形式,设计一款普通话教学产品呢?基于这样的灵感,几位成员一拍即合,决定为偏远地区的儿童打造一款寓教于乐、提升普通话水平的趣味公益应用。
 
「语言海洋泡泡」主要为留守儿童、贫困地区儿童以及未能完全掌握普通话的学生所设计,为他们提供一个纯净的素养教育平台。「对于孩子来说,他们对世界的好奇心就像泡泡一样,在阳光下会折射出美丽的色彩。」
 
为了更好地激发 3-6 岁儿童的学习兴趣,团队决定用「泡泡」作为核心功能的形态。软件设置了「生活小能手」、「安全我最棒」、「蔬果故事会」三个版块,小朋友们可以在掌握生活常识、自我保护、健康饮食三个领域知识的同时提升普通话水平。
在整个跟读环节,「语言海洋泡泡」首先利用「一句话识别」功能对儿童语音进行转换识别,再利用「句子相似度」进行评判。产品还会根据孩子的普通话水平,智能匹配相应的学习音频,助力儿童高效学习普通话。
 
这种「开盲盒」的玩法确实极具吸引力:进入产品界面后,小朋友只需要选择其中一个泡泡,点击「收听」、「我来说一遍」、「点击再听一次」,就能完成跟读学习。
「语言海洋泡泡」这个项目希望通过科技的方式帮助孩子们边玩边学,在学习中提高说普通话的信心。在目前的功能中,任何用户都能够在「语言海洋泡泡」中提交新的泡泡,为丰富语料库贡献自己的力量。

神奇泡泡的最强技术助攻

从 2022 上半年开始,「语言海洋泡泡」产品得到了现任中共理塘县委常委、副县长 (挂职) 叶小明的支持。来自杭州钱塘新区的叶县,希望并认同用科技帮助孩子多说普通话。目前,「语言海洋泡泡」产品已在理塘县开展试点运用,当地越来越多的幼儿园已经加入到「语言海洋泡泡」的队伍里。

团队也提到,根据调查统计,85% 以上的人对语音识别系统的功能表示满意。

理塘当地的小朋友正在使用「语言海洋泡泡」。


那么,这样一款寓教于乐的公益产品,是怎么打造的呢?在决赛路演中,团队成员分享了搭建「语言海洋泡泡」的过程。

实际上,几位成员之前并没有自然语言处理产品的项目经验。在这个过程中,腾讯云担任了「最强技术助攻」的角色,提供了关键的语音识别技术支持。

「语言海洋泡泡」的核心落地场景在于跟读过程的语音对比,在每一个泡泡下,都包含一条 10 秒之内的普通话教学语音。团队翻阅了很多学龄前儿童的书籍,收集到几千条可用素材,而这些语料也大多是团队成员自己录制的。

团队成员提到,基于腾讯云开放的「实时语音识别」和「一句话识别」两项功能,他们不再需要从零开始设计算法,直接调用 API 就能实现产品的语音识别功能,大大减少了项目手写代码的工作量。

于是,他们把精力主要放在了语料库的搭建上:尽管在最初录入的过程中,语料的总体识别精确度仅在 80% 左右。但经过一周内的语料库更新和多次测试,团队将精确度迅速提升到了 90% 以上。

从落地效果上看,目前中小词汇量非特定人语音识别系统识别精度已经大于 98%,同时「一句话识别」与自然语言处理中的「语言相似度识别」功能已经非常成熟,精准度与稳定性均可得到保证。 
 
此外,腾讯云的微搭平台提供了很多现成的行业化模板、拖拽式组件和可视化配置,即便此前完全没有接触过语音领域的工作,使用者也能快速融会贯通。

一位负责开发的成员表示:「这样一来,我们就可以把更多的时间放在产品功能的实现上,省去了代码上的很多基础工作。」

腾讯云提供的语音识别开发者资源。


按照团队成员们的规划,未来的「语言海洋泡泡」会包含更多有趣的功能,比如泡泡收藏、用户排行榜、排位赛等。同时,这款产品也会借助推荐算法,不断提高用户接收知识难度,比如说从简单的一句话进化为绕口令,帮助孩子们不断提升普通话水平。

目前,腾讯云的 AI 语音识别技术已经支持中、英、粤、川、韩、日等多个语种,涵盖通用、音视频、金融、医疗、游戏等领域。基于腾讯云开放的众多技术能力,团队也展开了更多想象,比如加入语言互通的功能,包括藏英、藏汉语言互通。

「或许三、四岁的小朋友还意识不到学好普通话的长远意义,但看到这些孩子能够开心地使用产品,能够边玩边学、真正有所收获,我们就很感动了。」团队成员表示。

技术有「深度」,更要有「温度」

围观了决赛路演全程之后,可以发现,所有入围决赛的选手都提到了一个关键词:腾讯云。
 
如「北辰之星」团队一般,借助腾讯云提供的各项技术能力,各个团队的成员们即使没有太多的技术经验,「一键调用」就能完成产品搭建。
 
比如「悦智 AI 实验室」团队开发了专注于新生儿黄疸识别的「保健熊」小程序,目前已植入广州市卫健委官方公众号「广州健康通」,为全广州市的新生儿提供黄疸随访健康保障。小程序使用了腾讯云 AI 的图像识别技术后,黄疸识别模型准确率提升到了 97%。
 
致力于河狸保护的团队「阿尔泰山地区自然保护协会」,则使用腾讯云的 AI 图像识别等技术,开发了一款新应用,能够快速识别红外相机拍摄的动物种类。过去人工需要 2、3 个月甚至半年时间的审核工作,现在仅需要两天,对观测新栖息地的生物多样性和栖息地生态环境打造效果起到了关键作用。
 
这两支团队获得了本届挑战赛的公益创新大奖,还将分别获得 20 万人民币奖励、20 万腾讯云微搭奖励(代金券)以及 20 万腾讯云 AI 奖励(资源包)。

腾讯云副总裁、腾讯优图实验室总经理吴运声表示,在腾讯 Light· 公益创新挑战赛中,我们希望看到更多参赛选手和开发者能够从社会生活中发现问题、并通过腾讯云提供的  AI 等技术能力来解决这些问题。
 
写到这里,那么对于腾讯自身来说,又为何要举办这样一场公益创新挑战赛?也许,腾讯 Light・公益创新挑战赛正是腾讯推动云上 AI「技术价值外溢」的重要动作。
 
2020 年底,腾讯可持续社会价值事业部创新办学实验室、腾讯优图实验室、腾讯云 AI、企鹅伴成长、企鹅爱地球等联合发起了首届腾讯 Light・公益创新挑战赛,赛题主要关注儿童保护、适老化、生物多样性保护等社会痛点问题。
 
这一公益技术赛事迄今已连续举办两届。面向行业开发者、公益爱好者,腾讯决定开放腾讯云上的 AI 技术,并充分发挥腾讯的技术能力与平台链接资源,扶持优秀项目,以科技创新的方式满足各领域的公益需求,探索人工智能与更广泛的社会价值的结合。
 
依托腾讯优图实验室等顶级人工智能机构,腾讯云已开放超过 300 多项 AI 原子能力、80+AI 行业解决方案,其中,腾讯云 AI 在公有云日处理图像超 50 亿张,日处理语音超 250 万小时,日处理自然语言超千亿句,服务全球用户数超过 12 亿。

多年来深耕产业互联网的技术积淀和落地经验,就是腾讯推动「技术价值外溢」的底气。

去年第二届腾讯 Light・公益创新挑战赛的启动仪式上,腾讯高级执行副总裁、云与智慧产业事业群 CEO 汤道生曾说过:「服务于人,是人工智能最大的价值,用 AI 助力更美好的世界,这样的探索存在于实验室里,存在于产业中,也正走向更广阔的社会应用中。」
 
为了实现这一愿景,腾讯已经搭好了服务社会的公益平台。一年一度的大赛圆满落幕了,但科技与公益的故事,仍然未完待续。
产业腾讯云泡泡
相关数据
人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

语料库技术

语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;事实上,语料库英文 "text corpus" 的涵意即为"body of text"。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

腾讯机构

腾讯,1998年11月诞生于中国深圳,是一家以互联网为基础的科技与文化公司。我们的使命是“通过互联网服务提升人类生活品质”。腾讯秉承着 “一切以用户价值为依归”的经营理念,为亿万网民提供优质的互联网综合服务。 腾讯的战略目标是“连接一切”,我们长期致力于社交平台与数字内容两大核心业务:一方面通过微信与QQ等社交平台,实现人与人、服务及设备的智慧连接;另一方面为数以亿计的用户提供优质的新闻、视频、游戏、音乐、文学、动漫、影业等数字内容产品及相关服务。我们还积极推动金融科技的发展,通过普及移动支付等技术能力,为智慧交通、智慧零售、智慧城市等领域提供有力支持。

http://www.tencent.com/
相关技术
暂无评论
暂无评论~