Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

蛋酱报道

能对话、能讲故事,他用树莓派把1960年代的老式收音机改造成了智能音箱

爷爷留给我的收音机,大概可以焕发新生了。

对于大部分年轻人来说,老式收音机都是不可磨灭的童年回忆。随着科技的发展,我们收听有声内容的方式从收音机变成了手机,后来又变成了智能音箱,而内容本身也从电台节目变成了播客。

近日,YouTube 上的一位博主将一台老式德律风根收音机改造成了能讲故事、能对话的智能音箱。
改造这样一台收音机并不困难。首先,我们准备一下所需要的的材料:

  • 树莓派
  • Google AIY 语音套件 v1
  • 无线电
  • Google Cloud Platform
  • Google Dialogflow
  • 螺丝刀
  • 焊接设备
  • 接线
  • 扬声器
  • 开关

硬件组装

像大多数改造类的手工项目一样,本次也是使用一些旧的电子设备,确切地说是一台德律风根收音机,产于 1960 年代的西德。在完成拆解工作以后,他们保留了扬声器和按钮的部分。然后添加树莓派和其他零件。
如果想要实现可交互功能,意味着必须有一个麦克风和扬声器,并具备处理能力。这里使用的是 Google AIY 语音工具包,按照其操作说明即可。
树莓派安装在右下角。

如何讲故事

作者设计了一个决策树,提供了一个严格的故事框架,因此用户不能随意提问。


当你看到这个框架后,你会发现创建具有交互性的事物并不难,实际上只需要了解以下几个短语之间的区别即可:Laserpointer、Lockpick、Drink、Take Bribe、Refuse Bribe。

然后是设计对话环节。Google Dialogflow 是一个免费的自然语言理解平台,任何人使用它都能很轻松地设计用户的对话交互。

类似的程序有很多,但 Google Dialogflow 是免费的并且容易上手,你可以参照这份入门指南:https://cloud.google.com/dialogflow/docs/tutorials

下图是用户与收音机对话、收音机确定如何响应之间的步骤,语音转文本和聊天机器人软件需要协同工作。在这个项目里,数据流的运行方式如下:


1、麦克风检测到有人在讲话,并记录音频。
2-3、Google AI(语音转文本)处理音频,并将用户说的单词提取为文本。
4-5、聊天机器人(Google Dialogflow)接收此文本并匹配正确的回复,然后将其发送给树莓派。
6-7、AI 使用该文本生成人工语音。
8、将音频通过扬声器播放给用户。

最终你将得到一台可对话的 “智能音箱”,它的声音很有磁性,美中不足的是语气有些生硬,并且故事欠缺一点吸引力,
Anyway,至少这台智能音箱的外观更加复古且美丽吧。

参考链接:
https://www.raspberrypi.org/blog/raspberry-pi-turns-retro-radio-into-interactive-storyteller/
工程树莓派
相关数据
自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

推荐文章
暂无评论
暂无评论~