人力成本减少30%,内容审核准确率99%,百度大脑全新发布人机协同审核管理平台

移动互联网的发展,为公众提供了更加便利的交流条件和更加多元化的沟通方式。但同时,内容安全问题也正在变得越来越严峻。在行业法律法规愈加健全、各类专项整治行动越来越多的今天,面对每天来自用户的海量生成内容,如何做到高效而精确的审核?这是对所有内容生产企业的一大考验。

5 月 15 日下午,在百度大脑开放日的互联网内容安全线上专场中,百度 AI 技术生态部高级产品经理 Nathan 为大家分享了百度大脑在内容审核与应用场景方面的技术与经验,并宣布了百度大脑全面人机协同审核管理平台的全新发布。

image.png

说到内容审核,大多数人心中都会有一些概念。比如「黄赌毒」、「三俗」、「暴恐」等内容,都是互联网内容安全领域的高发问题。

内容审核是企业运营中的「关键一环」,但在这个环节上,却有着诸多挑战:

首先,人工审核存在培训成本高、流动性大、评判标准不统一等问题,并且与机器相比效率更低,对审核的人员本身来说,也极容易造成心理疲倦和精神压力,但同时人工审核也存在更加准确、灵活的优点。

其次,对于机器审核来说,关于互联网内容的监管和业务审核规则更新频率较快,适配难度比较大。根据变化的审核规则而频繁地更改代码、调整审核策略会使得整体操作成本变高,与此同时,针对不同的规则来制定模型也需要大量的训练数据,从现实角度来看具备成本高和难度大的缺陷。

当然,最好的办法就是人机协同。根据此前的业界实践来看,想要搭建高效的人机协同审核系统并不简单,从建设到打通,需要相当长的周期以及相当多的机器资源,并且对任务分发和系统设计方面的要求也非常高。

image.png

Nathan 介绍说:「基于百度大脑全面的 AI 技术积累和广泛的业务经验积累,我们希望利用 AI 审核能力帮助企业进行高效、低成本的审核,助力内容风险管控。」

在图像审核方面,百度大脑设置了色情识别、广告识别、恶心图识别、违规行为等 14 项细致的审核维度,并预置了结合监管要求实时更新的违禁图库。

image.png

在文本审核方面,设置了色情、政治敏感、恶意推广等 8 项审核维度与用户评论、注册信息、视频弹幕等多个审核场景。此外,大家在浏览网络内容的时候,常常会发现一些以符号、数字、同音字代指的违禁词汇,依靠预设的「用户自定义黑词库」,这类内容也会被加入审核范围之内。

image.png

在语音审核方面,百度大脑也设置了 9 项维度。对于清晰度较高的语音内容来说,平台使用语音识别+文本审核的模式进行鉴定,但值得注意的是,对于枪声等内容来说,平台则使用声学模型进行审核,以减少遗漏。

image.png

当然,内容审核领域的规则是相对复杂的,这也是为什么人工审核一般会比机器审核质量更高的原因。为了让审核更加适配业务需求,百度大脑打造了一套可供自由组合的「标签体系」,对于用户来说,重新排列组合这个单个标签,就可以让模型实现「量身定制」的效果:

具体来说,比如色情类别下,就包括 20 个标签,但对于不同场景来说,「色情」的范围各不相同。在视频直播和母婴论坛中,「性玩具」就会被划入「违规」的行列,但在电商中则会通过审核;而除了母婴论坛之外,任何的「儿童裸露」都会被认定为「违规」内容。

让审核规则的配置更加灵活、方便,这也是百度大脑开放平台的内容审核业务策略之一。在此基础上,Nathan 宣布了百度人机协同审核管理平台的全新发布。

image.png

「人机协同」是其亮点之一。以短视频审核为例,在这一审核流程中,视频内容将首先经历「AI 机审」阶段,包括视频帧与音频方面的内容审核,之后将进入人机协同审核管理平台。最终的审核结果将是机审结果与人工复审结果的综合判断。

相比于传统的人工审核流程,该平台的「人机协同审核」可降低约 30% 的人力消耗,而且能够保障 99% 的准确率

包括在机审阶段,内容将按照机审结果区分高危和普通人审组,「普通组」的违规内容比例更低,可降低审核人员的精神压力,提升审核速度,而「高危组」的内容违规比例较高,会交由更具经验的审核人员处理,有利于审核效果和速度的双重提升。

image.png

按照惯例,Nathan 也介绍了近期百度大脑开放平台最新开放的多项 AI 能力:

自然语言处理方面,新闻线索溯源、资讯舆论态度、智能文档分析 3 款产品全新上线,地址识别服务、UNIT 平台则进行了升级。

在文字与图像识别方面,全新发布了 iOCR 缴税回单识别功能,通用文字识别、图像清晰度增强、色情识别模型三项功能进行了升级。

目前,人机协同审核平台已经正式上线,人力外包服务商与内容生产企业均可申请测试人机审核平台:https://ai.baidu.com/solution/oasis

产业百度人脸识别百度大脑
相关数据
准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

百度机构

百度是全球最大的中文搜索引擎,是一家互联网综合信息服务公司,更是全球领先的人工智能平台型公司。2000年1月1日创立于中关村,公司创始人李彦宏拥有“超链分析”技术专利,也使中国成为美国、俄罗斯、和韩国之外,全球仅有的4个拥有搜索引擎核心技术的国家之一。

https://www.baidu.com/
推荐文章
暂无评论
暂无评论~