原来AI离我这么这么这么这么近!

实不相瞒,爱(wu)岗(suo)敬(shi)业(shi)的小编本人最近时不常地就会刷刷各种产品网页,不刷不知道,一天逛两次百度 AI 开放平台官网,每次都有新发现!

就拿刚刚过去的这一两个月来说,通过接入百度 AI 图像识别、人脸识别语音合成、OCR、UNIT 等等技术升级自家功能的 App,小编两只修长的小手(这是重点?)加在一起都数不过来了!小小一个手机里,数不清有多少人工智能成果在里面,不信请看:

1

图像识别

做家居,也搞艺术

家装必上的家图网,是一个可以收藏心水家居好图和“按图索骥”购买家具的 App。接入百度 AI EasyDL 定制化图像识别技术之后,上传一张当下流行的北欧极简风客厅照片,“猜你喜欢”功能就会给你推荐同属极简风、同样在客厅的系列照片。

不仅如此,框选图中特定的家具,还能快速找到匹配商品,可以说是为家居剁手扫清了障碍!

2

不管是花花草草还是满汉全席,万能识图应用“万图拍”都能一拍辨真身。能够拥有认人识物的本领,就是因为接入了百度 AI 图像识别的人脸检测、植物识别、动物识别、菜品识别等接口。

对了,它还能根据人脸检测给你的颜值打分,建议拿去跟你的塑料花姐妹互相赞(shang)美(hai)哟~

3

逛展从来只是闲逛?不,艺术之旅本来可以更高阶。“听听展”搜罗了北上广深和香港等一线城市的展览展讯,不仅如此,借助百度相似图搜索技术,从此以后你只要对着艺术品图片拍张照,就能快速获取它的相关资料、艺术家简介和展览信息,堪称爱逛展星人的福音。

4

“保益互动”致力于用科技手段解决视障者无法看见的问题,通过接入百度文字识别、图像识别、语音合成技术,“盲人随心看”解决方案真正实现了所见即所听:

眼前的物品是什么、物品上写了什么,都尽可能详尽地识别转化成语音播报给使用者。

5

招聘求职、房屋租售、教育培训、同城交友……堪称网络版集市的本地生活服务平台“百姓网”,汇集了各种各样的图片信息。海量信息在带来方便的同时也意味着网站审核成本的提高。

在接入百度 AI 图像审核技术之前,网站对于涉黄与涉政类等严重的违规行为无法约束,且后台无法检索到相关的违规图片。而如今,这些都早已不成问题。

1

OCR

做翻译官,也做监测员

着急用钱但借贷平台审核发放速度太慢?百度卡证识别基于业界领先的深度学习技术,帮助“云白条”对借贷用户实现快速认证,身份证等卡证信息上传到平台之后会被人工智能快速识别并完成鉴定。

缩短注册流程的同时,还能帮助平台有效规避业务风险:如果同一个用户用不同的身份证或银行卡进行了若干次识别后,平台将判定其有欺诈嫌疑。

2

对于很多人来说,出国旅游的一大乐事就是痛快地买买买。可是面对琳琅满目的商品,瓶瓶罐罐上面的外语完全看不懂怎么办?

别担心,使用接入了百度 OCR 技术“携程助手”对着它们拍个照,图上的外语文字就能被自动识别,并且实时翻译成中文,让你漂洋过海去“剁手”!

3

消费分级的时代,低价团购网站异军突起成为巨大的流量入口,可是在满屏的促销信息之中,不少虚假广告、三无产品也混杂其中。

借助百度 OCR 技术,促销网站“团800”可以第一时间获取并筛选出针对性的图片,根据敏感词库自动识别出图片中的敏感词文字,及时采取解决措施,为消费者安全保驾护航。

1

语音技术

掌握自己的方向盘


游戏虽小,“五脏俱全”。4399小游戏里的弹幕,添加了百度语音合成功能后,可以实时地将玩家互动时候的文字内容,同时以语音的方式输出,以往大型端游才有的语音协同功能,在4399小游戏里也能体验到了!

2

语音报单功能出现之前,出租车司机和顺风车司机可能经常在“趴活儿”的时候看着手机屏幕盯花了眼。“嘀嗒出行”通过接入百度语音合成技术,将文字的订单信息通过语音播报的的方式传给司机师傅,快捷又安全。

3

限宽限高还有限行,货车司机的路线规划真是伤脑筋。“货车宝”通过接入百度语音功能,在导航过程中通过语音交互实现播报指引导航。

而且在违章查询、个人认证时,借助百度图像识别技术,对着行驶证拍个照,就能快速录入车架号、发动机号这些长段的容易反复输错的数字。

4

孩子跟着早教设备进行跟读的时候,如果没有准确及时的反馈机制,那很可能学到最后学了很多错误知识。

通过接入百度 AI 智能语音识别技术,早教 App“小伴龙”能够对95%以上的语音做出有效判断,在学成语、背诗词的过程中帮助孩子纠正发声。

5


树林间的风声、夏天的雷雨声、木柴燃烧的哔哔啵啵声,在完全暗下来的卧室里,听着助眠 App 里这些让人安心的声音,很容易就会睡着。可是,点击屏幕进行交互的时候,却经常被亮光“闪瞎”。

“小睡眠”通过接入百度 AI 语音识别语音合成技术,不用动手、不用亮屏,躺在床上闭着眼睛语音操作,就能听到想听的助眠声音,帮你快速地安安稳稳地睡个好觉。

人脸识别

能签到,也能画像

健身锻炼当然是轻装上阵最好,想象一下:在你终于下定决心走进健身房的时候,发现会员卡没带!多尴尬!再想象一下:大汗淋漓地从健身房出来的时候,还要从包儿里翻出卡来确认课时。

瀚辰跆拳道馆通过引入百度人脸识别,改变了原有学员签到、课时管理的模式,原先需要耗费大量精力做的工作,现在只需在上课的时候刷一下脸,5秒就能完成。

2

3月24日,首个24小时智能图书馆,“苏州工业园区图书馆·星海馆”开始试运营。这座图书馆结合了百度 AI 人脸识别技术,不仅可以刷脸开门,还可以刷脸借书!

只要绑定个人信息,点击刷脸借阅,等个两秒钟,书就借好了,so easy,再也不用担心出门忘带图书卡了!

1

UNIT

是导游,也当医生

想要拥有超一流的旅游体验,但是又没有时间(或者干脆就是因为懒)做详细攻略,真是让人纠结。

结合百度 AI 智能交互解决方案,“出趣游”蜕变为具备 AI 语音咨询、路线语音导览、景点实时讲解、实用公共服务等功能的“智能”工具,帮你制定出行、规划游览路线,甚至还能帮你找到公共卫生间。

2、

互联网已经如此发达,在线医疗问答已经很普遍,如果家里的爱车也能有这种“家庭医生”就好了。

借助人机对话定制化平台 UNIT“汽车大师”在传统的回答用户环节,针对常见问题不再需要匹配相关技师去人工回答问题,有效节省27%的人力,要不要去店里修?问一下就清楚。

百度AI
百度AI

产业AI
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

图搜索技术

在计算机科学中,图遍历(也称为图搜索)是指在图中访问(检查/或更新)每个顶点的过程。这样的遍历是按访问顶点的顺序进行分类的。比如,树遍历就是图遍历的一个特例。 与树遍历不同,图遍历可能需要多次访问某些顶点,因为在转换到一个已经被探索的顶点之前,它并不一定是已知的。随着图形变得越来越密集,这种冗余变得更加普遍,导致计算时间增加;随着图形变得越来越稀疏,相反的情况也成立。 因此,通常需要记住哪些顶点已经被算法探索过了,这样就可以尽可能少地重新访问顶点(或者在最坏的情况下,防止遍历无限延续)。这可以通过将图中的每个顶点与在遍历期间的“颜色”或“访问”状态相关联来完成,然后在算法访问每个顶点时检查和更新。如果顶点已经被访问过,它就被忽略了,路径就不再被继续了;否则,算法会检查/更新顶点,并继续它当前的路径。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

暂无评论
暂无评论~