Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

这个「慢性子」大厂,囤了数千件AI专利

机器之心原创

作者:张倩

「有的时候科技给人的感觉有点复杂,甚至会变成负担。如果你能够把这种科技变成更无感的体验,其实对用户来讲本身就是一种进步。」 ——OPPO 副总裁、研究院院长刘畅

4 月 26 日是世界知识产权日。知识产权包括专利权、商标权、著作权等,这些都意味着创新。创新如果得到智慧、诀窍和天赋的滋养和充实,就会成为一种知识产权资产,推动企业发展、经济复苏、人类进步 [1]。每个企业都始于创新,也因为创新而越走越远。

前段时间,全球专利数据库 incoPat 发布了《2020 年公告发明授权专利年报》。报告显示,在 2020 年国家知识产权局公告的授权专利中,OPPO 以 3580 件位列企业专利权人第二

这一结果令人眼前一亮。一直以来,OPPO在外界看来并不那么「硬核」。但是,在竞争激烈的手机市场,任何一款产品都不可能在没有技术优势的支撑下持续热销,OPPO 也不例外。

仔细观察一下 OPPO 近几年的动向就可以发现,这家公司其实一直在科研上不断加码,而且非常重视人工智能等前沿技术。根据清华大学人工智能研究院、清华 - 中国工程院知识智能联合研究中心联合发布的《人工智能发展报告 2020》,2011-2020 的十年间,OPPO 在国内 AI 专利申请数量统计中排名全国第三

截至 2021 年 3 月 31 日,OPPO 在 AI 领域的全球专利申请已经超过 2450 件

但是,很多用户可能会问:这么多的 AI 专利到底用到了什么地方?为什么我感觉不到?在「世界知识产权日」这个特殊的日子。我们就来扒一扒 OPPO 这些 AI 专利技术的去向。

OPPO 那么多 AI 技术到底用到哪儿了?

技术服务于痛点

作为一家科技产品公司,OPPO 对用户的观察是细致入微的,在部署 AI 时也是基于这种洞察。

比如在应用广泛的听、说、看领域,OPPO 看到的问题是:「如何让用户拍的照片更清晰?」「在短视频时代,如何帮助用户更省力地制作 vlog?」「用手机拍视频的用户是不是也需要美颜、画质增强?」「返乡是否需要隔离能不能直接问语音助手而不是自己动手查?」

这些对用户痛点的洞察构成了 OPPO 技术研发的出发点,也解释了 OPPO 为什么需要那么多 AI 专利。

以上面提到的问题为例,其实每个问题都涉及很多技术点。比如,要打造一款帮助用户剪辑 vlog 的 APP,OPPO 需要在视觉、语音、语义等多个方面进行打磨,才能实现智能剪辑、智能配乐、智能字幕生成等功能。视频的画质增强和美颜也同样具有挑战性,需要解决美颜不自然(如磨皮过度)、视频处理算力消耗大等问题。而语音助手则涉及如何让 AI 听懂人类语言、更加理解人类情感。

为此,OPPO 打磨了一批优秀的算法。

在视觉方面,为了让设备拍出的照片更清晰,OPPO 提出了将模糊图片「算」清晰的 RFB-ESRGAN 模型,并且凭此技术在 AI 顶会 CVPR 2020「极端超级分辨率感知」比赛中拿到了第一名

视频的画质增强和美颜涉及的视觉算法就更多了,Reno 5 系列首发的FDF 全维人像视频系统就是一个集大成者。该系统拥有感知人像画质增强两大引擎。其中,感知人像引擎针对人像区域进行优化,在人脸区域标记了 296 个关键点来实现五官和轮廓细节的区分,可以支持「AI 分区磨皮」、「AI 肤色检测」、「人脸畸变矫正」等功能,还能达到 200FPS 以上的运行帧率。

基于三维稠密关键点的实时人脸重建和 3D mesh 人脸重建。

而画质增强引擎则是一套能保障用户在绝对多数场景下都能拍出满意画面的算法合集,使用户在逆光、运动等场景下也能拍到非常清晰的视频。在最新的超级防抖算法中,OPPO 加入了场景检测、运动趋势判断等功能,可以满足手持移动延时摄影等场景的需求。此外,OPPO 还对超级夜景视频和 HDR 算法进行了融合升级。

在语音、语义方面,OPPO 的技术团队在语义理解、情感分析、文本分析等方面下足了功夫。在中文语义理解领域最权威的测评基准之一——CLUE 上, OPPO 于十个子领域中的三个子领域(AFQMC、CHID、WSC)得分第一。2020 年 3 月,OPPO 在第十四届国际语义评测比赛(SemEval 2020)上获得社交媒体文本情感分析西班牙语 / 英语混合语言赛道的冠军;今年 1 月 18 日,OPPO 小布助手算法能力问鼎百度「千言数据集:文本相似度」行业测评,并刷新该赛事 LCQMC 数据集最高分记录。

当然,这些技术并不是用来刷榜的,而是真真切切地用到了 OPPO 的终端产品中,比如 Reno5 系列手机上搭载的 AI 焕采视频美颜和 AI 视频增强,更加实用、体贴的小布助手 2.0,帮助用户快速剪辑 vlog 的 APP「即录」等。

做技术,OPPO 还是个「细节控」

除了前面那些应用比较广泛的场景,OPPO 对用户痛点的洞察力还体现在很多不易被用户察觉的细节上,比如对 ColorOS 和传感器功耗的优化。

对 ColorOS 的优化体现在 AI 自适应护眼、AI 自流畅、AI 预启动等方面。

AI 自适应护眼系统能根据环境变化自动调节屏幕的亮度、色彩,还能实现全局低蓝光、低亮环境无频闪等功能。

AI 自流畅系统得益于 ColorOS 对 Android 的深度技术优化,能够保证手机在持久使用后依旧稳定流畅。受益于此,OPPO Reno5 Pro 的应用启动响应速度提升了 38%,触控响应速度提升了 21%,界面交互流畅性提升了 15%,视频录制提升了 33%。

AI 预启动能自主学习用户在晨起、午间、夜间和睡前时间段内的高频应用,并在各时间段预启动相应应用,有效地缩减应用打开时长与启动卡顿,从而让用户一触即开,大幅提升应用启动效率。

对传感器功耗的优化也有 AI 的参与,如情境感知。情境感知就是通过传感器及其相关的技术使设备能够「感知」到当前的情境,然后让 AI 依靠收集到的信息对用户的行为进行更细致的「猜测」。这项技术的好处在于,它可以帮助传感器确定何时应该处于何种激活状态,从而在保持 always-on 状态的同时节省功耗,保证设备的整体续航。这项技术对于设备中那些需要一直在后台运行的应用尤其重要。

可以说,这些技术的打磨都是从用户痛点出发的,落地场景比较明确,也让 OPPO 的 AI 看起来非常「实用」。

这种「拿着场景找技术」的理念在前几年 OPPO 刚进军 AI 的时候就已经初现端倪。以 OPPO 2018 年发布的语音助手 Breeno(小布助手的前身)为例,与部分追求「超级」对话能力的语音助手不同,Breeno 将关注点放在提供基于情景的个性化服务上。因此,在之后的两年里,OPPO 并没有一股脑地在通用语音助手上做能力升级,而是针对不同场景下用户的不同使用需求,提供「应景」的语音对话。在这一理念的指引下,前段时间更新的「小布助手 2.0」已经拥有了很多非常实用的功能,如热门城市限行信息查询、抗疫信息智能查询、行程定制、同传翻译、情感交互等。

OPPO 的这盘 AI 棋,打算怎么下?

从上面这些例子我们可以总结出,OPPO 的 AI 技术主要布局在计算机视觉、语音、自然语言处理机器学习这几大方向。但是,这些大方向底下又有很多小方向,OPPO 是如何取舍的呢?

OPPO 副总裁、研究院院长刘畅介绍说,OPPO 研究院在 AI 的布局方面主要有两个原则:「有用」「前沿」

OPPO 副总裁、研究院院长刘畅

「有用」意味着技术要与多元的场景和设备充分融合,彼此间相得益彰,为场景造势。这些场景又可以细分为头部场景长尾场景。头部场景包括我们前面提到的拍照、录像、语音助手等使用频率比较高的功能,OPPO 会花很大的力气来打磨适合这些场景的算法,形成丰富的技术积累。长尾场景则指那些使用频率不高但却很有用的场景,比如 OPPO 产品中已经搭载的 AI 证件照、AI 老照片修复、多人表情识别等。

能够支持多人表情识别的《表情包大作战》,目前已上线 OPPO 小游戏商店。

「前沿」则意味着 OPPO 研究院会分出一部分精力去研究强化学习、无监督学习、弱监督学习等前沿技术,看看这些东西能否和 OPPO 结合,碰撞出一些火花。目前,这一尝试已经得到了一些回报,比如 2020 年 10 月,OPPO 在国际机器翻译(WMT20)大会举办的新闻翻译赛道上获得了 7 金 5 银 6 铜的成绩,相关产品也已经在智慧办公等场景中落地。

OPPO 研究院内部,研究精力的分配有个3:5:2的说法。「3」指的是拿出 30% 做技术转化,这部分接近产品和业务;「5」指的是拿出 50% 做前瞻性布局,虽然是前瞻,但这部分的基本方向和价值是能够明确的,只是不确定能不能成功;剩下的 20% 则主要靠个人驱动,不设限,允许少部分天才或「疯子」发挥自己的才能。

从这个比例我们可以看出,「前沿」或「前瞻」在 OPPO 的科研中占了很大的比例,这也意味着,OPPO 已经从一家「产品优先」的公司转向「前沿技术 + 产品」双轮驱动的公司

是什么力量驱动了这种转变?刘畅给出了两个原因:一方面,OPPO 的研究已经有了一些积累,足够支撑自己进行一些对未知领域的探索;另一方面,研究团队并不满足于现状,「对未来有一些憧憬,有一些兴趣」,希望建立新的技术壁垒。

OPPO 沉淀了那么多技术,为什么之前都不动声色?

前面已经提到,虽然沉淀了那么多技术,但 OPPO 给外界的印象似乎一直没那么「硬核」。对此,刘畅表示,过去 OPPO 更加强调立足用户,放大技术带给用户的价值,而非技术本身。

为什么会有这种选择?刘畅坦言,「有的时候科技给人的感觉有点复杂,甚至会变成负担。如果你能够把这种科技变成更无感的体验,其实对用户来讲本身就是一种进步。

他还认为,技术是一个量变到质变的过程,不用急于一时,也不用刻意通过一些手段去改变公众对 OPPO 的认知。「我觉得它可能会变成一个自然而然的过程,我们就脚踏实地地去储备我们的技术,去做好我们前瞻的一些研究。等到有一天它自然而然会影响到我们的产品,自然而然地会通过产品去向用户传达我们是一家有技术的科技公司。我们希望它是一个自然而然的过程。」

OPPO 创始人兼首席执行官陈明永在 OPPO 未来科技大会 2020 上也表达过类似的观点,他引用的是围棋宗师吴清源的一句话:「真正厉害的围棋高手是,你围你的地盘,我围我的地盘,我们相互之间不见厮杀,最后结果高下立见。」对于 OPPO 来说,竞争不是一件你死我活的事情,也并非一两场比拼就能分出胜负,需要坚持长期主义,不计较一时的利益。OPPO 将这种态度称之为「本分」。

OPPO 创始人兼首席执行官陈明永。

这种「不急于一时」的心态也渗透到了 OPPO 研究院的内部团队。为了打造一种「长线作战」的氛围,OPPO 会鼓励一些研究员和工程师去做一些夯实基础的事情。「我们是一个接力赛,不一定跑最后一棒、冲过终点的那个人有鲜花和掌声,其实我们前面跑第一棒、第二棒、第三棒的人,他们同样都是冠军,」刘畅表示。对于那些分阶段交付的技术,OPPO 研究院会定义出过程中间的技术交付节点,让大家都看到技术的演进过程。

可以说,在打磨技术方面,OPPO 是很沉得住气的。在竞争激烈的终端市场,企业很容易陷入一种「恐惧式创新」的氛围,即为了不被淘汰而盲目创新。但陈明永认为,这种心态背离了创新的初衷,并不能为用户的使用体验带来实质性的提升。因此,OPPO 提出了「致善式创新」的理念,即坚持将科技作为一种手段,最终还是要落实到人的应用。

在经历短暂的「狂欢」之后,AI 领域逐渐归于平静。与前几年疯狂追求 SOTA(state of the art)的氛围相比,学界和业界对待研究成果的态度也变得更加理智。去年 10 月份,谷歌科学家 Eric Jang 在一篇文章中谈到了顶会审稿人在评审论文时可能会考虑的标准,其中一条就是「不能『只是』SOTA」。他指出,有些审稿人会打击那些只在一两项指标上取得突破的所谓 SOTA 结果,认为这样的研究「创新不足」或「只是增量性研究」。在业界,这一点更加明显,比起那零点几的提升,业界讨论更多的其实是落地问题,即如何利用 AI 降本增效,提升用户体验。这也是 OPPO 一直以来重点解决的问题。

OPPO 的确是真金白银要投进去做研发,想做事情」

对于人才来讲,OPPO 也是颇具吸引力的。这种吸引力主要体现在两个方面。

首先,OPPO 拥有广阔的应用场景和强大的平台。做智能最重要的是要有场景和有平台支撑,OPPO 在产品上的成功为这两样提供了坚实的保障。刘畅表示,「有很多人才引进是自带课题的,因为他本身是那个领域的专家。来了过后,又遇到这样一个平台,是一种多方共赢的模式。」

其次,OPPO 对科研的投入是巨大的。「OPPO 的确是真金白银要投进去做研发,想做事情,」刘畅表示。为了吸引、培养更多人才,OPPO 还在 2019 年成立了产学研事务部,围绕科技创新、人才培养、对外交流三大模块与高校和科研院所全面拓展合作。

OPPO 未来科技大会 2020 上,OPPO 表示,在未来,OPPO 将会按照「3+N+X」科技跃迁的战略,以坚定的技术信仰,持续加大研发投入与人才引入,坚定推进「致善式创新」。有了这一战略的加持,OPPO 未来的技术之路将走得更加稳健。

参考资料:[1]https://baijiahao.baidu.com/s?id=1689465117778177795&wfr=spider&for=pc

产业人工智能OPPO
相关数据
清华大学机构

清华大学(Tsinghua University),简称“清华”,由中华人民共和国教育部直属,中央直管副部级建制,位列“211工程”、“985工程”、“世界一流大学和一流学科”,入选“基础学科拔尖学生培养试验计划”、“高等学校创新能力提升计划”、“高等学校学科创新引智计划”,为九校联盟、中国大学校长联谊会、东亚研究型大学协会、亚洲大学联盟、环太平洋大学联盟、清华—剑桥—MIT低碳大学联盟成员,被誉为“红色工程师的摇篮”。 清华大学的前身清华学堂始建于1911年,因水木清华而得名,是清政府设立的留美预备学校,其建校的资金源于1908年美国退还的部分庚子赔款。1912年更名为清华学校。1928年更名为国立清华大学。1937年抗日战争全面爆发后南迁长沙,与北京大学、南开大学组建国立长沙临时大学,1938年迁至昆明改名为国立西南联合大学。1946年迁回清华园。1949年中华人民共和国成立,清华大学进入了新的发展阶段。1952年全国高等学校院系调整后成为多科性工业大学。1978年以来逐步恢复和发展为综合性的研究型大学。

http://www.tsinghua.edu.cn/
相关技术
机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

基准技术

一种简单的模型或启发法,用作比较模型效果时的参考点。基准有助于模型开发者针对特定问题量化最低预期效果。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据库技术

数据库,简而言之可视为电子化的文件柜——存储电子文件的处所,用户可以对文件中的数据运行新增、截取、更新、删除等操作。 所谓“数据库”系以一定方式储存在一起、能予多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合。

机器翻译技术

机器翻译(MT)是利用机器的力量「自动将一种自然语言(源语言)的文本翻译成另一种语言(目标语言)」。机器翻译方法通常可分成三大类:基于规则的机器翻译(RBMT)、统计机器翻译(SMT)和神经机器翻译(NMT)。

监督学习技术

监督式学习(Supervised learning),是机器学习中的一个方法,可以由标记好的训练集中学到或建立一个模式(函数 / learning model),并依此模式推测新的实例。训练集是由一系列的训练范例组成,每个训练范例则由输入对象(通常是向量)和预期输出所组成。函数的输出可以是一个连续的值(称为回归分析),或是预测一个分类标签(称作分类)。

文本分析技术

文本分析是指对文本的表示及其特征项的选取;文本分析是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

百度机构

百度是全球领先的人工智能平台型公司。百度大脑是中国领先的“软硬一体AI大生产平台”,是百度AI的集大成,对外全方位输出超过270多项核心AI能力,服务230万开发者。飞桨是中国首个全面开源开放、功能完备的产业级深度学习平台,是中国自主研发的“智能时代的操作系统”。百度智能云是百度AI To B 业务的重要承载者和输出者,是产业智能化领导者。小度助手是中国领先的对话式人工智能操作系统,拥有中国市场最繁荣、开放的对话式人工智能生态,今年6月,小度助手语音交互次数超过58亿次。作为全球领先的、最活跃的自动驾驶开放平台,百度Apollo代表中国最强自动驾驶实力,被知名研究公司Navigant Research列为全球四大自动驾驶领域领导者之一。目前聚焦在以自动驾驶、汽车智能化、智能交通为核心的三大赛道。自动驾驶技术方面,超过十项中国第一,实力领跑行业。智能交通方面,百度 “ACE交通引擎”是全球首个车路行融合的全栈式智能交通解决方案。

https://www.baidu.com/
机器之心机构

机器之心,成立于2014年,是国内最具影响力、最专业、唯一用于国际品牌的人工智能信息服务与产业服务平台。目前机器之心已经建立起涵盖媒体、数据、活动、研究及咨询、线下物理空间于一体的业务体系,为各类人工智能从业者提供综合信息服务和产业服务。

https://www.jiqizhixin.com/
围棋技术

围棋是一种策略性棋类,使用格状棋盘及黑白二色棋子进行对弈。起源于中国,中国古时有“弈”、“碁”、“手谈”等多种称谓,属琴棋书画四艺之一。西方称之为“Go”,是源自日语“碁”的发音。

OPPO机构

OPPO,成立于2004年,是一家全球性的智能终端和移动互联网公司,致力于为客户提供最先进和最精致的智能手机、高端影音设备和移动互联网产品与服务,业务覆盖中国、美国、欧洲、东南亚等市场。

www.oppo.cn
暂无评论
暂无评论~