作者李泽南

OPPO推出智能助理Breeno:让人工智能覆盖所有场景

本周三,OPPO 开发者大会在北京国际会议中心举行。在大会上,OPPO 发布了智能助理 Breeno。不同于以往的手机智能助理,作为 5G +时代智慧交互的中枢,Breeno 可以连接所有智能设备,使用多种交互方式,为我们带来未来式的智慧生活体验。

「Breeno 作为新产品,明年将随新款手机一同面向消费者发布,届时将会完成一亿以上用户规模的覆盖。」Breeno 智能助手产品负责人庞佳宁表示。

Breeno,手机的 AI 大脑

虽然市面上越来越多的手机都推出了基于 AI 的功能,从最早苹果推出的 Siri、微软的 Cortana,到近期手机厂商发布的 Bixby、Jovi、YOYO 等智能助理型产品,随着手机变得越来越智能,智能助理能做到的事情也越来也多,甚至加入了神经网络芯片,实现本地化的 AI。

但就目前看来,多数厂商还是更关注在如何让手机更懂用户的指令层面上,而人工智能的应用方向还在不断拓展的过程中,真正实现听懂用户之后应该做些什么是接下来手机厂商应该思考的问题。

另一方面,即将到来的 5G 技术也将加速 AI 的发展,并且与 AI 融合,让云端的强大算力能够为本地的 AI 应用提供支持,带来全新的体验。

与以往手机、智能音箱和电脑上的智能助理不同,OPPO 在开发者大会上发布的 Breeno 将关注点放在提供基于情景的个性化服务上。一方面,Breeno 带来了多模交互方式,让用户以更自然的方式与机器交流,另一方面,Breeno 在实现更懂用户所需的前提下,进一步提供贴心服务,在这个层面上,OPPO 强调服务直达化和多样化。

在服务直达方面,OPPO 副总裁、互联网事业部总裁段要辉表示:「在过去,服务和内容是通过 APP 提供给用户的,但在未来,服务将以更加直观、简洁的方式呈现给用户。」

服务多样化方面,OPPO 不再单打独斗,而是将 Breeno 接口开放给更多开发者和服务供应商,汇聚生态力量为用户带来更好的体验,这也是 Breeno 相较于目前现有的同类产品先行的一步。

Breeno 一共包含 7 个模块,覆盖了智能手机的大多数使用场景。

在 OPPO 的愿景中,Breeno 是一个泛生态中枢,它可以理解成为手机的 AI 大脑,不仅能够与用户交流,更能够协调所有智能化的资源,触达用户生活的每个角落,让服务可以贯穿不同场景。

「比如我们在全局搜索中搜索机票,打开一个快应用,就可以直接预定机票,在负一屏同时会自动生成一个日程计划,它会随着行程的临近,提醒我航班的动态、是否延误取消、在线值机选座、目的地天气、穿衣指南等。」OPPO 副总裁、软件工程事业部总裁吴恒刚介绍道:「想要在这些场景呈现,只需要合作伙伴将相关内容一次性接入就可以实现。在未来,OPPO 会逐步开拓更多应用场景。」

不止是智能助理

在开发者大会中,OPPO 表示在未来将着重打造计算机视觉、语音语义、智能优化三大方向的 AI 能力,目前面向这三大领域,OPPO 已经积累了大量的研究成果。目前,其在 AI 声纹唤醒与语音助手、3D Facekey AI 人脸识别、摄像头场景识别、AI 场景感知等方面均有突破性进展,Breeno 的七大模块正是基于这些 AI 技术的整合而实现。

Breeno 整合手机所有传感器收集到的多模态数据,通过机器学习算法和平台的聚合,可为用户带来自然的交互体验。

从开发者大会上公布的架构图来看,OPPO 主要是通过打通硬件、软件和服务等平台,构建了一套融合全系统能力的技术框架。Breeno 虽然是一套复杂的 AI 系统,但面向用户呈现的确是最简单的交互方式。

人与人之间的交流模式是自然的多模交互,除了语言外,人与人之间还可通过丰富的肢体动作、表情等交流,而借助 AI 能力,Breeno 正在借助语音、机器视觉、手势体感等感知技术,实现更符合人类交互习惯的自然多模交互。

在实现自然交互的基础上,进一步具备分析和决策能力才能为用户提供服务。OPPO 在自然语言理解知识图谱、情境计算、个性化推荐等认知技术上也进行了深入研究,这些能力都被整合在 Breeno 中,让 Breeno 可以认知世界、理解用户需求从而更好的服务用户。

OPPO 的 CoreAI 架构内置模型转换器,可支持多种神经网络框架。在硬件方面,CoreAI 有动态调度器,可调用 CPU、GPU、神经网络计算单元的算力,以最大化任务执行效率。

作为一款智能助理产品,Breeno 是 AI 能力的集中展现,但事实上,AI 作为一种基础能力已经逐渐开始渗透到智能手机的各个方面中。

开发者大会上,OPPO 还介绍了自研的全场景、系统级资源调度优化方案 HyperBoost。这项技术不仅仅是对 GPU、CPU 进行「超频」,它还可以分别针对系统、应用和游戏,对芯片算力、存储、网络等资源进行智能管理,更加合理地释放手机性能,这也同样是 AI 能力的渗透。

另一方面,AI 能力也开始渗透到系统层面。OPPO 的智能手机操作系统 ColorOS 自 5.0 版开始加入了智能语音助手和 3D 人脸支付等人工智能技术。目前,这款系统也积累了大量用户:截止今年 10 月底,ColorOS 全球月活人数已经超过 2.5 亿。

在人们过去的印象中,OPPO 似乎并不以应用新技术见长,但近来这家公司的新动作让人眼前一亮。今年 7 月,OPPO 发布了年度旗舰 Find X 全面屏手机,采用「双导轨潜望结构」等创新技术为其品牌注入了更多科技力,如今其在 AI 层面上的持续发力,以及此次开发者大会透露出的诸多前瞻性布局,也显示其正在朝科技平台型公司转型。

「在明年,OPPO 的研发投入将从目前的 40 亿增加到 100 亿。」段要辉在大会上表示。OPPO 未来将聚焦于 5G、AI 等前沿科技的探索和多智能终端的研发,希望能为用户带来更加丰富的科技体验。

截止 2018 年 11 月,OPPO 全球申请专利数量超过 27,000 件,授权数量超过 5000 件。其中 AI 相关的专利超过了 300 项。

Breeno 是开放平台

此次开发者大会上 OPPO 也进一步强调了 Breeno 将作为开放平台把 OPPO 的 AI 能力带到开发者身边,鼓励开发者共同探索基于 5G、物联网人工智能的新场景,构建智能化服务生态。

「Breeno 开放的服务能够协助开发者共享系统级能力,帮助大家减少开发与投入成本,更加专注在服务质量的提升。」吴恒刚介绍说。「OPPO 也和很多 IoT 厂商展开合作,可以使用手机的多个系统级入口来操作设备。」

Breeno 具体的开放策略将集中在两个层面,首先是自身能力的开放,OPPO 将面向开发者开放 Breeno 语音技能平台和智慧服务平台,在用户普遍对安装 APP 兴趣减少的当下,负一屏和直达服务的智能助手将成为新的流量入口,Breeno 的开放为开发带来了新的机遇。

另一个层面是作为独立产品面向行业开放,OPPO 表示,Breeno 未来将会登陆多品牌、多终端设备,为更多地伙伴提供智能服务。

除了开放策略,OPPO 在开发者大会上还发布了「引力计划」,面向全球优秀开发者提供十亿扶持资源,涵盖应用合作、小游戏、独立游戏、快应用以及应用出海多个领域,致力于通过扶持和让利等方式吸引更多优秀开发者加入。OPPO 智能化服务生态开放全流程合作项目,包括内容合作、技术合作、云平台、流量开放、服务直达和个性化服务等几十项能力。开发者可以在内容、技术、流量等各方面与 OPPO 展开合作。

很多科技公司和手机厂商都在构建生态,OPPO 的体量和态度是它的优势。「在 OPPO 有一种理念叫本分,实际上在多年的合作过程中,我们发现这不仅仅是一个口号。」腾讯渠道合作部总经理李致峰在开发者大会上表示,「他们真的是在实际工作中践行这个理念——OPPO 的今天,是十几年来坚持下来的结果。今天的数据说明了一切。」

人工智能技术每一次的飞跃都伴随着硬件技术的进步,随着 5G 技术即将实用化,5G 与 AI 技术结合将会催生的出更多新场景和应用,而 Breeno 会成为 OPPO 面向万物互融时代构建的智慧中枢。

「未来,手机必然会成为多智能终端的中心,同时 5G 也会催生更多的智能终端,各种生活中的数字产品都会通过 5G 相连,并直接或间接地服务用户。OPPO 会围绕"健康"和"家庭"场景,布局多智能终端」OPPO 副总裁、研究院院长刘畅表示。

产业5G智能助手OPPO
1
相关数据
来也机构

「来也」是国内领先的人工智能交互平台,由常春藤盟校(Ivy League)归国博士和MBA团队发起,核心技术涵盖自然语言处理(NLP)、多轮对话控制和个性化推荐系统等。公司已获得数十项专利和国家高新技术企业认证。 来也的愿景是通过AI赋能,让每个人拥有助理。C 端产品小来是智能化的在线助理,通过业内创新的AI+Hi模式,提供日程、打车、咖啡、差旅和个性化查询等三十余项技能(覆盖400w用户和数十万服务者),让用户用自然语言发起需求并得到高效的满足。B端品牌吾来输出知识型的交互机器人和智能客户沟通系统,帮助各领域企业客户打造行业助理。目前已经在母婴,商旅,金融和汽车等行业的标杆企业实现商业化落地。

https://www.laiye.com/
微软机构

微软是美国一家跨国计算机科技公司,以研发、制造、授权和提供广泛的计算机软件服务为主。总部位于美国华盛顿州的雷德蒙德,最为著名和畅销的产品为Microsoft Windows操作系统和Microsoft Office办公室软件,以及Xbox的游戏业务。微软是美国《财富》杂志2015年评选的世界500强企业排行榜中的第95名。

https://www.microsoft.com/en-us/about
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

自然语言理解技术

自然语言理解是人工智能的核心课题之一,也被广泛认为是最困难和最具标志性的任务。最经典的两个人工智能思想实验——图灵测试和中文房间,都是围绕自然语言理解来构建的。自然语言理解在人工智能技术体系中的重要性不言而喻,它一方面承载着机器和人的交流,另一方面直达知识和逻辑。自然语言理解也是人工智能学者孜孜以求的圣杯,机器学习的巨擘 Michael I. Jordan 就曾经在 Reddit 上的 AMA(Ask Me Anything)栏目中畅想用十亿美元建立一个专门用于自然语言理解的实验室。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

操作系统技术

操作系统(英语:operating system,缩写作 OS)是管理计算机硬件与软件资源的计算机程序,同时也是计算机系统的内核与基石。操作系统需要处理如管理与配置内存、决定系统资源供需的优先次序、控制输入与输出设备、操作网络与管理文件系统等基本事务。操作系统也提供一个让用户与系统交互的操作界面。

推荐文章
暂无评论
暂无评论~