泽南作者

打造四大AI平台:腾讯优图的视觉AI To B打法

腾讯的 AI 与产业互联网已进入全新发展阶段,优图实验室的视觉智能在其中将发挥怎样的作用?

「人工智能本身就是一场跨国跨学科的探索,正在将人类的认知推向更快更高更强,也势必带给我们一场前所未见的科技和产业革命,」在近日在上海举行的世界人工智能大会 WAIC 2020 上,马化腾对人工智能的未来发出了这样的预测。

今天,AI 技术正变得无所不在,新基建和产业互联网将为各行各业的发展带来新增量。面对新的发展机遇,腾讯提出了全新的战略,而腾讯优图实验室在其中正扮演着重要角色。

「我们可以看到,视觉 AI 相关应用业务正在飞速增长,这反映了企业端的人工智能技术需求正在释放,」腾讯优图实验室副总经理黄飞跃表示。

四大 AI 平台齐亮相

在 7 月 10 日的 WAIC 大会上,腾讯提出的「双引擎 + 双轮」驱动人工智能发展新形式再次引来人们的关注。与此同时,腾讯优图一口气发布了应用 视觉 AI 能力的四大平台:AI 泛娱乐平台、广电传媒 AI 中台、内容审核平台和工业 AI 平台,成为了大会的亮点。

在 WAIC 2020 上,腾讯优图实验室总经理吴运声进行了「新基建新生态下的计算机视觉」的主题演讲。

首先是泛娱乐平台,依托腾讯在社交娱乐产品上的丰富实践,优图在人脸融合、人像分割、人像变化、美颜美妆等方面积累了丰富的泛娱乐基础能力,打造了泛娱乐全栈工具箱,其中包括 AI 互动体验展解决方案、AI 创意营销解决方案、美颜特效 SDK 三大解决方案。

在广电传媒行业,通过引入 AI 技术,腾讯可以将视频处理效率提升至 1:1(花费 1 小时处理剪辑 1 小时长度的视频),实现符合标准的结果输出。在智能审核场景中,AI 能帮助媒体内容管控效率提升并降低漏检率。

广电媒体 AI 中台支持多维度的视频理解和智能处理,为视频运营侧提供结构化的数据结果,建立了多模态搜索的基础,提升了素材再利用效率(如帮助视频再生产,打造内容专栏)。另外,能够通过视频理解结果进行内容运营,打造千人千面的媒体应用。

腾讯优图内容审核平台可提供审核一站式服务。在常规审核系统基础能力之上还包含 ACG 场景识别、儿童色情识别、低俗场景识别等功能。在识别效果上,鉴黄、监控、鉴证的准召率超过 99%。客户接入后,三天即可完成定制化模型训练,两小时内完成客户定向策略运营。这一技术可以更好地满足用户的实时定制需求,目前已在电商、文创、广电等行业解决方案中广泛应用。

面向传统行业的工业 AI 平台则可以快速满足工业领域的缺陷检测、备件拍照识别、工厂工效优化等客户需求。并提供数据管理、在线训练、效果评估、业务编排等全过程个性化训练服务,满足上述场景的差异化需求。平台支持私有化及公有云部署,提供业界领先的加速、调度与容器服务,以更少的硬件资源支持更复杂的业务。

腾讯表示,这些平台具备灵活权限及可拓展能力,合作伙伴可直接使用平台进行工业 AI 项目交付,还可基于平台进行上层业务开发,实现 AI 技术与行业能力的能力互补,合作共建各领域的工业 AI 解决方案。

八年如一日,聚焦视觉 AI

在人工智能领域里,感知智能的发展速度更快。根据清华大学的数据显示,计算机视觉、语音技术及自然语言处理技术的市场规模占比分别为 34.9%、24.8% 和 21%,视觉几乎是落地最顺利、商业化程度最高的领域,这也是腾讯优图一直以来的主要研究方向。

「在腾讯 930 业务组织调整之后,云与智慧产业事业群 CSIG 成为腾讯 to B 的战略窗口,而优图是 CSIG 的主要实验室。对于优图来说,我们的定位已更加清晰——专注于视觉 AI 的技术研发,」黄飞跃告诉我们。

2008 年,从清华博士毕业的黄飞跃加入当时的腾讯研究院,带领 5 人小组投身开发一款名为「QQ 影像」的桌面处理软件,他们是国内大规模应用计算机视觉先进技术的最早一批从业者。今天这个团队已经发展成为几百人规模,算法人员比例超过 60% 的大型研究机构,成为了腾讯旗下,乃至计算机视觉领域鼎鼎有名的优图实验室。

优图从 2012 年成立至今,在技术从探索到落地的过程中,核心思路一直在发生转变。「在优图团队刚刚成立时,我们主要想的是怎样把技术本身做好,」黄飞跃说道。「我们花费大量时间深入理解了技术产生价值的方式,只有如此,才能够把技术价值放大到最大。」

优图团队最初的任务是把其开发的压缩算法应用到 QQ 空间里。在这里,技术产生了一定的价值,但主要是业务成本降低和体验优化,仍没有带来最直接的用户体验提升。

在 2015 年,优图把视觉 AI 技术应用到微众银行的远程开户,实现了业务的对外输出。很快,优图实验室与腾讯云开始了整合,技术落地走上了快速轨道。

迄今为止,优图已打造了超过 15 种行业解决方案,为腾讯公司内部如 QQ、QQ 空间、微信、微视、腾讯云等超过 90 余个产品业务提供计算机视觉 AI 算法支持,并联合腾讯云、微信等腾讯内外部合作伙伴,向工业、教育、交通、文旅等领域共同输出行业解决方案。

腾讯优图在发展新技术时,一直以技术的应用价值为导向。「我们在进行新技术研发时都会思考这个维度,这意味着它们必然是有业务基础的。这也是和团队基因有关系,初始团队成员很多都具有相关的业务背景。」黄飞跃介绍道。

在业务落地后,优图会持续关注技术的实际价值和用户体验,根据反馈需求和发现的问题,不断迭代优化技术成果。随着工具不断升级,技术会越来越好,适用场景越来越多,更多用户也会为此买单,实现良性循环的正反馈过程。

在探索方向上,腾讯优图团队的技术研发非常聚焦——不倾向于发散放大技术,而是不断积累技术,将一些方向做深做透。优图倾向于在成功技术的基础上不断拓展范围,从而保证自己在一定方向上保持最好。

目前,优图旗下最热门的技术之一人脸核身,支持了北京、上海等全国多地的健康码,以及一些银行大额转账的过程中的核身过程,这项技术在市场占有率上保持了绝对领先。

优图核身技术的领先,正是不断迭代优化的结果。「我们自 2014 年就开始了身份识别技术的研发,从微众银行、腾讯云慧眼,再到微信小程序。我们接触到了大量客户和场景,在这个过程中不断提升了技术能力。」黄飞跃表示。

核身技术中,除了识别人脸之外,活体检测是重中之重:黑产会不断尝试在各个方面进行攻击。据介绍,从 2014 年至今,优图已经迭代了 5 个不同的解决方案,从最开始的动作唇语,到交互检测,到腾讯独创的光线核体方案,再到现在更加先进的解决方案,通过海量用户触达,不断更新的技术,优图把身份检测这件事做到了极致。

目前优图人脸核身技术的流程。

「今年优图上线的全新人脸安全技术对于物理攻击、模型合成攻击、深度学习对抗样本都有很强的防御能力。我们的多模态活体检测技术已经通过了国家银行卡检测中心 BCTC 的人脸识别技术检测,达到了金融支付级安全标准。」黄飞跃说道。

不仅如此,优图也在不断探索前沿技术。优图公开发表的论文涵盖 ICCV,CVPR,AAAI 等各类顶级会议,仅 2020 年即被国际计算机视觉顶级会议 CVPR 接收了 17 篇论文。此外,优图与中科院软件所、中科院自动化所、上海交通大学、厦门大学、密西根州立大学、中山大学等国内外高校开展高校合作项目,在人脸人体基础技术、神经网络模型压缩、视觉内容检索、智能硬件平台、视频内容分析等研究方向上进行合作研究。

转向 B 端,成为新生产力

2017 年,腾讯正式提出 AI in All 战略,并逐渐搭建了以人工智能实验室、前沿科技实验室为双引擎,消费互联网和产业互联网为双轮的 AI 战略布局。在 930 组织结构变革之后,优图成为了腾讯云与智慧产业事业群(CSIG)旗下的成员,该事业群成为腾讯 To B 的战略窗口,是腾讯 20 余年历史上首次出现完全面向企业客户的大业务单元。

目前,腾讯为工业制造、医疗、政务、文旅、金融等行业提供了 90 余种互联网解决方案,其中 80% 应用到了人工智能技术。

黄飞跃认为,产业互联网最终的目的还是服务好 C 端用户:「C to B 是腾讯产业互联网的优势,腾讯拥有超过 10 亿用户,也有长期积累的洞察和经验。我们会把对于 C 端的服务经验输出给合作伙伴,帮助企业更好地触达用户。」

从面向消费者转为面向企业,是否会影响未来技术创新的思路?其实在优图内部,人们对此也有疑问。「在转型的过程中,我们有很多人都在思考这个问题,研究团队承担的角色不仅是业务落地的支持——这对于优图来说缺少持续发展的动力,」黄飞跃说道。「我们不仅要支持业务发展,另一方面也要不断探索,寻找业界、学术界的技术趋势,能够产生更大价值的技术。我们会花费更多精力进行研发。」

在 WAIC 大会上,腾讯公司副总裁、腾讯研究院院长司晓正式发布了《腾讯人工智能白皮书:泛在智能》,作为腾讯第一份全面介绍 AI、阐述腾讯 AI 布局和思考的白皮书,该书从宏观环境、技术研究、落地应用、创新经济、制度保障五个维度,描绘了泛在智能的全景。计算机视觉是白皮书的重要内容:随着 5G 等技术的发展,工业视觉正在成为新的生产力,而人们对于视频内容的需求将催生更为广泛的市场。

腾讯在白皮书中指出,疫情之后的近未来将是全球经济重建的重要时期,也是社会转型的重要时期。这为人工智能的发展打开了新的窗口期,并将提供丰富的实践场,一个「泛在智能」的世界正在加速成为现实。

5 月 26 日,腾讯宣布未来五年将投入 5000 亿,用于新基建项目的进一步布局,人工智能是重点投入的领域。现在,腾讯希望让人工智能发挥产业互联网「中央处理器」的作用。
产业AI平台计算机视觉腾讯优图
暂无评论
暂无评论~