机器之心原创
作者:张倩
「有的时候科技给人的感觉有点复杂,甚至会变成负担。如果你能够把这种科技变成更无感的体验,其实对用户来讲本身就是一种进步。」 ——OPPO 副总裁、研究院院长刘畅
4 月 26 日是世界知识产权日。知识产权包括专利权、商标权、著作权等,这些都意味着创新。创新如果得到智慧、诀窍和天赋的滋养和充实,就会成为一种知识产权资产,推动企业发展、经济复苏、人类进步 [1]。每个企业都始于创新,也因为创新而越走越远。
前段时间,全球专利数据库 incoPat 发布了《2020 年公告发明授权专利年报》。报告显示,在 2020 年国家知识产权局公告的授权专利中,OPPO 以 3580 件位列企业专利权人第二。
这一结果令人眼前一亮。一直以来,OPPO在外界看来并不那么「硬核」。但是,在竞争激烈的手机市场,任何一款产品都不可能在没有技术优势的支撑下持续热销,OPPO 也不例外。
仔细观察一下 OPPO 近几年的动向就可以发现,这家公司其实一直在科研上不断加码,而且非常重视人工智能等前沿技术。根据清华大学人工智能研究院、清华 - 中国工程院知识智能联合研究中心联合发布的《人工智能发展报告 2020》,2011-2020 的十年间,OPPO 在国内 AI 专利申请数量统计中排名全国第三。
截至 2021 年 3 月 31 日,OPPO 在 AI 领域的全球专利申请已经超过 2450 件。
但是,很多用户可能会问:这么多的 AI 专利到底用到了什么地方?为什么我感觉不到?在「世界知识产权日」这个特殊的日子。我们就来扒一扒 OPPO 这些 AI 专利技术的去向。
OPPO 那么多 AI 技术到底用到哪儿了?
技术服务于痛点
作为一家科技产品公司,OPPO 对用户的观察是细致入微的,在部署 AI 时也是基于这种洞察。
比如在应用广泛的听、说、看领域,OPPO 看到的问题是:「如何让用户拍的照片更清晰?」「在短视频时代,如何帮助用户更省力地制作 vlog?」「用手机拍视频的用户是不是也需要美颜、画质增强?」「返乡是否需要隔离能不能直接问语音助手而不是自己动手查?」
这些对用户痛点的洞察构成了 OPPO 技术研发的出发点,也解释了 OPPO 为什么需要那么多 AI 专利。
以上面提到的问题为例,其实每个问题都涉及很多技术点。比如,要打造一款帮助用户剪辑 vlog 的 APP,OPPO 需要在视觉、语音、语义等多个方面进行打磨,才能实现智能剪辑、智能配乐、智能字幕生成等功能。视频的画质增强和美颜也同样具有挑战性,需要解决美颜不自然(如磨皮过度)、视频处理算力消耗大等问题。而语音助手则涉及如何让 AI 听懂人类语言、更加理解人类情感。
为此,OPPO 打磨了一批优秀的算法。
在视觉方面,为了让设备拍出的照片更清晰,OPPO 提出了将模糊图片「算」清晰的 RFB-ESRGAN 模型,并且凭此技术在 AI 顶会 CVPR 2020「极端超级分辨率感知」比赛中拿到了第一名。
视频的画质增强和美颜涉及的视觉算法就更多了,Reno 5 系列首发的FDF 全维人像视频系统就是一个集大成者。该系统拥有感知人像和画质增强两大引擎。其中,感知人像引擎针对人像区域进行优化,在人脸区域标记了 296 个关键点来实现五官和轮廓细节的区分,可以支持「AI 分区磨皮」、「AI 肤色检测」、「人脸畸变矫正」等功能,还能达到 200FPS 以上的运行帧率。
基于三维稠密关键点的实时人脸重建和 3D mesh 人脸重建。
而画质增强引擎则是一套能保障用户在绝对多数场景下都能拍出满意画面的算法合集,使用户在逆光、运动等场景下也能拍到非常清晰的视频。在最新的超级防抖算法中,OPPO 加入了场景检测、运动趋势判断等功能,可以满足手持移动延时摄影等场景的需求。此外,OPPO 还对超级夜景视频和 HDR 算法进行了融合升级。
在语音、语义方面,OPPO 的技术团队在语义理解、情感分析、文本分析等方面下足了功夫。在中文语义理解领域最权威的测评基准之一——CLUE 上, OPPO 于十个子领域中的三个子领域(AFQMC、CHID、WSC)得分第一。2020 年 3 月,OPPO 在第十四届国际语义评测比赛(SemEval 2020)上获得社交媒体文本情感分析西班牙语 / 英语混合语言赛道的冠军;今年 1 月 18 日,OPPO 小布助手算法能力问鼎百度「千言数据集:文本相似度」行业测评,并刷新该赛事 LCQMC 数据集最高分记录。
当然,这些技术并不是用来刷榜的,而是真真切切地用到了 OPPO 的终端产品中,比如 Reno5 系列手机上搭载的 AI 焕采视频美颜和 AI 视频增强,更加实用、体贴的小布助手 2.0,帮助用户快速剪辑 vlog 的 APP「即录」等。
做技术,OPPO 还是个「细节控」
除了前面那些应用比较广泛的场景,OPPO 对用户痛点的洞察力还体现在很多不易被用户察觉的细节上,比如对 ColorOS 和传感器功耗的优化。
对 ColorOS 的优化体现在 AI 自适应护眼、AI 自流畅、AI 预启动等方面。
AI 自适应护眼系统能根据环境变化自动调节屏幕的亮度、色彩,还能实现全局低蓝光、低亮环境无频闪等功能。
AI 自流畅系统得益于 ColorOS 对 Android 的深度技术优化,能够保证手机在持久使用后依旧稳定流畅。受益于此,OPPO Reno5 Pro 的应用启动响应速度提升了 38%,触控响应速度提升了 21%,界面交互流畅性提升了 15%,视频录制提升了 33%。
AI 预启动能自主学习用户在晨起、午间、夜间和睡前时间段内的高频应用,并在各时间段预启动相应应用,有效地缩减应用打开时长与启动卡顿,从而让用户一触即开,大幅提升应用启动效率。
对传感器功耗的优化也有 AI 的参与,如情境感知。情境感知就是通过传感器及其相关的技术使设备能够「感知」到当前的情境,然后让 AI 依靠收集到的信息对用户的行为进行更细致的「猜测」。这项技术的好处在于,它可以帮助传感器确定何时应该处于何种激活状态,从而在保持 always-on 状态的同时节省功耗,保证设备的整体续航。这项技术对于设备中那些需要一直在后台运行的应用尤其重要。
可以说,这些技术的打磨都是从用户痛点出发的,落地场景比较明确,也让 OPPO 的 AI 看起来非常「实用」。
这种「拿着场景找技术」的理念在前几年 OPPO 刚进军 AI 的时候就已经初现端倪。以 OPPO 2018 年发布的语音助手 Breeno(小布助手的前身)为例,与部分追求「超级」对话能力的语音助手不同,Breeno 将关注点放在提供基于情景的个性化服务上。因此,在之后的两年里,OPPO 并没有一股脑地在通用语音助手上做能力升级,而是针对不同场景下用户的不同使用需求,提供「应景」的语音对话。在这一理念的指引下,前段时间更新的「小布助手 2.0」已经拥有了很多非常实用的功能,如热门城市限行信息查询、抗疫信息智能查询、行程定制、同传翻译、情感交互等。
OPPO 的这盘 AI 棋,打算怎么下?
从上面这些例子我们可以总结出,OPPO 的 AI 技术主要布局在计算机视觉、语音、自然语言处理、机器学习这几大方向。但是,这些大方向底下又有很多小方向,OPPO 是如何取舍的呢?
OPPO 副总裁、研究院院长刘畅介绍说,OPPO 研究院在 AI 的布局方面主要有两个原则:「有用」和「前沿」。
OPPO 副总裁、研究院院长刘畅
「有用」意味着技术要与多元的场景和设备充分融合,彼此间相得益彰,为场景造势。这些场景又可以细分为头部场景和长尾场景。头部场景包括我们前面提到的拍照、录像、语音助手等使用频率比较高的功能,OPPO 会花很大的力气来打磨适合这些场景的算法,形成丰富的技术积累。长尾场景则指那些使用频率不高但却很有用的场景,比如 OPPO 产品中已经搭载的 AI 证件照、AI 老照片修复、多人表情识别等。
能够支持多人表情识别的《表情包大作战》,目前已上线 OPPO 小游戏商店。
「前沿」则意味着 OPPO 研究院会分出一部分精力去研究强化学习、无监督学习、弱监督学习等前沿技术,看看这些东西能否和 OPPO 结合,碰撞出一些火花。目前,这一尝试已经得到了一些回报,比如 2020 年 10 月,OPPO 在国际机器翻译(WMT20)大会举办的新闻翻译赛道上获得了 7 金 5 银 6 铜的成绩,相关产品也已经在智慧办公等场景中落地。
在 OPPO 研究院内部,研究精力的分配有个3:5:2的说法。「3」指的是拿出 30% 做技术转化,这部分接近产品和业务;「5」指的是拿出 50% 做前瞻性布局,虽然是前瞻,但这部分的基本方向和价值是能够明确的,只是不确定能不能成功;剩下的 20% 则主要靠个人驱动,不设限,允许少部分天才或「疯子」发挥自己的才能。
从这个比例我们可以看出,「前沿」或「前瞻」在 OPPO 的科研中占了很大的比例,这也意味着,OPPO 已经从一家「产品优先」的公司转向「前沿技术 + 产品」双轮驱动的公司。
是什么力量驱动了这种转变?刘畅给出了两个原因:一方面,OPPO 的研究已经有了一些积累,足够支撑自己进行一些对未知领域的探索;另一方面,研究团队并不满足于现状,「对未来有一些憧憬,有一些兴趣」,希望建立新的技术壁垒。
OPPO 沉淀了那么多技术,为什么之前都不动声色?
前面已经提到,虽然沉淀了那么多技术,但 OPPO 给外界的印象似乎一直没那么「硬核」。对此,刘畅表示,过去 OPPO 更加强调立足用户,放大技术带给用户的价值,而非技术本身。
为什么会有这种选择?刘畅坦言,「有的时候科技给人的感觉有点复杂,甚至会变成负担。如果你能够把这种科技变成更无感的体验,其实对用户来讲本身就是一种进步。」
他还认为,技术是一个量变到质变的过程,不用急于一时,也不用刻意通过一些手段去改变公众对 OPPO 的认知。「我觉得它可能会变成一个自然而然的过程,我们就脚踏实地地去储备我们的技术,去做好我们前瞻的一些研究。等到有一天它自然而然会影响到我们的产品,自然而然地会通过产品去向用户传达我们是一家有技术的科技公司。我们希望它是一个自然而然的过程。」
OPPO 创始人兼首席执行官陈明永在 OPPO 未来科技大会 2020 上也表达过类似的观点,他引用的是围棋宗师吴清源的一句话:「真正厉害的围棋高手是,你围你的地盘,我围我的地盘,我们相互之间不见厮杀,最后结果高下立见。」对于 OPPO 来说,竞争不是一件你死我活的事情,也并非一两场比拼就能分出胜负,需要坚持长期主义,不计较一时的利益。OPPO 将这种态度称之为「本分」。
OPPO 创始人兼首席执行官陈明永。
这种「不急于一时」的心态也渗透到了 OPPO 研究院的内部团队。为了打造一种「长线作战」的氛围,OPPO 会鼓励一些研究员和工程师去做一些夯实基础的事情。「我们是一个接力赛,不一定跑最后一棒、冲过终点的那个人有鲜花和掌声,其实我们前面跑第一棒、第二棒、第三棒的人,他们同样都是冠军,」刘畅表示。对于那些分阶段交付的技术,OPPO 研究院会定义出过程中间的技术交付节点,让大家都看到技术的演进过程。
可以说,在打磨技术方面,OPPO 是很沉得住气的。在竞争激烈的终端市场,企业很容易陷入一种「恐惧式创新」的氛围,即为了不被淘汰而盲目创新。但陈明永认为,这种心态背离了创新的初衷,并不能为用户的使用体验带来实质性的提升。因此,OPPO 提出了「致善式创新」的理念,即坚持将科技作为一种手段,最终还是要落实到人的应用。
在经历短暂的「狂欢」之后,AI 领域逐渐归于平静。与前几年疯狂追求 SOTA(state of the art)的氛围相比,学界和业界对待研究成果的态度也变得更加理智。去年 10 月份,谷歌科学家 Eric Jang 在一篇文章中谈到了顶会审稿人在评审论文时可能会考虑的标准,其中一条就是「不能『只是』SOTA」。他指出,有些审稿人会打击那些只在一两项指标上取得突破的所谓 SOTA 结果,认为这样的研究「创新不足」或「只是增量性研究」。在业界,这一点更加明显,比起那零点几的提升,业界讨论更多的其实是落地问题,即如何利用 AI 降本增效,提升用户体验。这也是 OPPO 一直以来重点解决的问题。
「OPPO 的确是真金白银要投进去做研发,想做事情」
对于人才来讲,OPPO 也是颇具吸引力的。这种吸引力主要体现在两个方面。
首先,OPPO 拥有广阔的应用场景和强大的平台。做智能最重要的是要有场景和有平台支撑,OPPO 在产品上的成功为这两样提供了坚实的保障。刘畅表示,「有很多人才引进是自带课题的,因为他本身是那个领域的专家。来了过后,又遇到这样一个平台,是一种多方共赢的模式。」
其次,OPPO 对科研的投入是巨大的。「OPPO 的确是真金白银要投进去做研发,想做事情,」刘畅表示。为了吸引、培养更多人才,OPPO 还在 2019 年成立了产学研事务部,围绕科技创新、人才培养、对外交流三大模块与高校和科研院所全面拓展合作。
在 OPPO 未来科技大会 2020 上,OPPO 表示,在未来,OPPO 将会按照「3+N+X」科技跃迁的战略,以坚定的技术信仰,持续加大研发投入与人才引入,坚定推进「致善式创新」。有了这一战略的加持,OPPO 未来的技术之路将走得更加稳健。
参考资料:[1]https://baijiahao.baidu.com/s?id=1689465117778177795&wfr=spider&for=pc