Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

一鸣作者

AI时代的产业智能化改造,被一家通讯公司玩转

2019 年的 AI 行业不再像往日那样狂热。一方面 AI 应用进入深水区,深入细分领域和场景的产品落地难,而另一方面大量企业面临融资压力,投资人也更加谨慎理性。这样的大背景下,一家不是科技巨头,也不是 AI 独角兽的通讯企业却把 AI 解决方案搞得有声有色。他们是怎么做的?


2019 年,AI 行业的关键词不再是「锐意进取」,而是「大浪淘沙」。

大量 AI 公司开始重新思考商业逻辑的合理性,而投资者也变得理性而谨慎。泥沙俱下的商业环境里,什么公司才能在这个 AI 的下半场赢得漂亮?

你可能会想到应用生态完善,有着雄厚技术实力的科技巨头。你也可能会想到一路高歌猛进,风头无量的 AI 独角兽。而在通讯领域,却有这么一家深耕行业产品与解决方案多年,直到 2017 年才开始进入 AI 领域的公司,率先提倡并践行「通讯+AI」并在去年完成了 D 轮融资。

这家通讯企业的名字,叫做容联。

AI 切入行业细分需求

企业通讯是一个发展了多年的行业,主要向企业客户提供通讯领域的服务和解决方案,如通讯服务(短信、语音、音视频等)、呼叫中心、客服、远程会议等。在早期阶段,企业主要向客户提供硬件设备设施,如光纤、服务器等,帮助客户建立通讯网络。

在互联网和云计算兴起后,上云成为主流。客户不再需要购买昂贵的硬件设备,而是从专业的服务商中购买云服务来解决通讯问题。

在这两年,云计算服务已日臻成熟。怎样从成熟领域挖掘新的业务增长点呢?从市场来看,许多客户有了细分的需求。这些需求中,无疑蕴藏着 AI 应用落地的可能性。

例如,客户们普遍面临降低通讯成本,提升效率的问题。以呼叫中心为例,高达 90% 的成本都需要投入在人力上——很多公司都需要维持庞大的客服团队,保证客服们不断接听询问、查询和投诉。在一些大型的金融机构中,客服团队的规模高达上千人。

同时,很多解决方案中亟待加入智能化辅助手段。比如说,很多企业的人工客服面临培训时间长,难以回应复杂而专业的问题。由于企业在业务增长的同时也面对查询、投诉量的陡增。此时花大价钱、加大力度进行客服培训,实际效果可能还要打折扣。这时候就需要一定的智能技术,辅助提升客服效率。

另一方面,在许多场景下,许多通讯解决方案都在走向智能化。例如,营销不再是向大量的客户进行无差别式的「骚扰」,而是在大数据分析的基础上,针对不同的客户群体进行精准的营销。

还有一个例子是:工业园区和制造厂房的视频监控系统,也需要加入更多智能化方法,对员工操作、生产线控制等方面进行智能化分析和管理。这些都需要大规模智能化的系统进行计算、协调、管理和调度,仅靠人力进行较为困难。


这些细分领域涌现的新需求,为 AI 应用提供了可能。在这一过程中,容联总结出了一套成熟的方法论,用来判断能不能用 AI,怎样用 AI。

层层分析,AI 并非万能

AI 是否能够真正应用呢?容联认为,判断 AI 能否应用需要经过三轮分析,即:1)能不能用;2)好不好用;3)行业发展形态。

首先,AI 在一些细分需求上可用,但在另一些需求上是不可行的。例如,同样是客服应用,一些呼叫中心就可以使用 AI 技术,如知识库、语音转文字等技术,帮助人工客服快速定位搜索结果,加快回复速度并提升准确性。而一些依赖专业销售话术的客服场景中,使用 AI 就不能像人工客服那样,通过从业经验和手段提升客户转化率了。

其次,AI 好不好用也是一个重要的问题。很多 AI 应用可以做到完成任务,但在实际使用中的效果并不令人满意。例如,在外呼场景中,AI 已经可以快速向多个目标用户进行呼叫,但机械式的方式让客户感到不适。类似的案例还有使用 AI 进行电话回访。由于技术的不成熟,回访收集的数据质量很差。

而且,AI 在某一行业的应用程度和该行业的发展密切相关。AI 依赖质量高、数量庞大的数据来提升性能。因此,在一些数据管理较好,有良好 IT 技术的行业,如金融业,AI 就可能会有更好的发展。另外,一些行业发展得还不够完善,客户对于新技术的接受程度不够高,客户没有相对充足的资金支持新技术的落地等因素,都会阻碍 AI 的应用落地。

从这些角度来看,AI 的应用范围并不是无限的。在通讯行业中,AI 应用落地取决于场景,可以使用 AI 进行辅助的产品,如呼叫中心、智能客服、精准营销、智能制造中的视频监控等。从行业来看,有着较好的 IT 基础设施、良好的数据积累和管理、资金较为充裕的行业、对技术接受度更高的行业,如金融、能源石化、电商等领域更容易落地 AI。

容联的 AI 产品体系:从应用到完整体系

我们知道,在通讯领域,AI 更多的是切入细分的场景中。有些是在已有解决方案上的智能化,而另一些则是需要 AI 参与辅助的场景。最后,如果不同的场景和应用都需要复用同样的 AI 模型,平台化是否是一个效率更高的选择?

容联的 AI 产品发展就遵循了以上三个思路,分别分为:AI 智能化应用、AI 智能化改造,以及 AI 中台。这三种产品形态上,可以看到容联以机器人、知识、AI 为中心,AI 平台为基础的整体产品架构。

容联的产品矩阵。

AI 智能化应用

AI 智能化应用是根据客户新需求——如为人工客服增加 AI 辅助、采用 AI 进行精准营销、在视频监控系统中增加 AI 检测等产生的新应用。它们主要切入业务流程中可以被智能化的环节。

例如,有一种语音导航方面的应用。过去在电话客服中,我们经常会听到「普通话服务请按 1」这样的引导语音,往往需要需要进行多次选择。这一场景中所对应的是 AI 语音引导应用。在接听电话后,用户可以直接说出自己需要办理的业务(如说出「办税」、「退款」等类似的字眼),AI 就可以帮助跳转到合适的人工客服。从而减少客户的等待时间,加快处理速度。

当这些应用可以走向市场后,客户可以将这些应用和自身已有的产品进行打通,从而实现部分业务流程的智能化。

AI 智能化改造

除了智能化应用外,另一种更加庞大和系统化的产品形态是 AI 智能化改造。

由于通讯行业有着 3 到 5 年的技术迭代周期。当客户需要采用新的解决方案的时候,可以通过一体化改造的方式,将整体的应用方案全部进行智能化改造,具体而言,这时候向客户提供的解决方案会包含一揽子的智能化应用和服务。客户采用了新的解决方案后,可以无缝地将数据迁移到新方案上,这一过程无感,但系统整体的效率大大提升。

AI 中台

最后一种产品被称为 AI 中台。和云平台类似,容联的 AI 中台提供一个智能化平台,其中集成了过去开发过的 AI 技术、模型、应用等。通过提供给头部大客户,AI 中台支持客户在已有的 AI 基础能力上开发相关的服务应用。这一中台也提高了容联云在技术研发上的效率,避免重复开发和浪费。

例如,很多 AI 应用需要一系列的底层技术支持。例如智能客服可能需要语音识别语音合成自然语言处理知识图谱等一系列 AI 相关的技术。如果某个企业想要实现 AI 应用,在没有 AI 平台的情况下可能需要全部研究一遍,投入成本高。在 AI 中台的帮助下,开发相关领域的应用会更加简单方便。

目前,容联已形成了完整的 AI 产品体系,名为「三中心一平台」。三中心指的是:机器人为中心、AI 为中心和知识为中心。这三个中心可以主要满足各个细分领域的实际需求。而一平台则是 AI 中台,主要提供基础的智能化能力。

技术不冒进:AI 的实际效果更关键

怎样做好 AI 产品?算法的性能是一方面因素,为什么很多实验室中的优秀算法无法落地呢?容联认为,AI 的算法固然重要,但是在业界进行落地的过程中还需要考虑很多因素。这些因素才是决定 AI 应用是否成功的关键。

有所为而有所不为

在 AI 算法的研究上,容联采用了和高校合作的方式。企业本身并不追求极致的实验室性能,而是将重点放在有技术潜力,能够快速实现应用的领域。而理论、模型等方面的探索性研究则通过联合实验室的方式进行。

例如,在研发哪些 AI 技术方面,容联就进行了选择。在 2017 年进入 AI 的时候,团队研判,在通讯领域较为重要的 AI 技术包括语音和语义两方面。但是,在语音技术上已有很多成熟的产品,许多实力强劲的科技巨头也在参与,因此团队没有投入太多。

容联的 NLP 技术一览。

而在包括自然语言处理知识图谱等语义理解的技术上,团队看到了这些技术对于拓展后续的产品线的作用。比如说,完成了语义理解的研究后,团队可以带着相关的经验继续投入到知识图谱,进而拓展至知识整理和知识分类。这些技术都可以应用在客服、企业知识库、智慧营销等场景下。因此他们在这一领域投入更多。

但是,学术性的研究则通过和高校的合作进行。2018 年,容联和华中科技大学成立了联合实验室,共同研究个性化推荐、情感计算、认知计算方面的学术成果。这样的产学研合作降低了企业独自研发的投入成本,同时能够吸收先进的学术成果。

行业积累解决数据匮乏问题

数据是阻碍 AI 应用落地的一大障碍。缺乏数据往往会导致 AI 的性能达不到要求。

对于这一问题,容联一般采用三种方法解决。首先,从公开渠道获取开源数据集,例如在文本数据方面,可以使用维基百科数据集。其次就是使用标注公司提供的数据。最后,由于多年的行业积累,很多头部客户已有类似规则库、知识库方面的数据,也可以灵活使用。

在数据方面,容联认为,有着多年行业积累,对于数据的理解也会更深刻。例如,在智能制造领域,有一种 AI 应用便是针对生产线上的工人进行监控。很多通用的计算机视觉算法会先在公开的通用数据集(往往有上万甚至更多图像)上进行训练,然后再进一步进行模型微调。实际上,有从业经验的团队会知道,这是一个封闭的场景,实际上可能只需要 5000 多的场景内图像,加上工程化技术便可以达到很高的准确率,使用开放数据集反而效果不佳。

千人千面,测评 AI 能力看应用

那么,在评估 AI 能力的时候应该采用什么样的标准?容联透露说,在不同的 AI 应用上,测评的方法也有所差别,主要需要看不同场景的应用。例如,在语音客服中,就有一个公式,需要结合计算「单路通话的通过率」和「语音识别准确率」两个指标,综合计算后再评测结果。

在问答机器人上则会采用剧本测试的方法。比如,在信用卡发卡客服应用上,测试团队会根据该场景中可能出现的用户交互问题等整理出一个剧本。这一剧本需要覆盖 80% 以上的情景。之后再请测试人员根据剧本进行测试。在测试中,很少出现测试人员会脱离剧本「调戏」AI 的情况。

此外,AI 应用必须重视工程能力,用于在算法性能不足的情况下弥补。在工具和开发框架的使用上,容联在研究中采用 PyTorch,在实际生产中采用 TensorFlow 等。

理性看待「AI 红利」

虽然 AI 热度不减,但是容联在进行 AI 产品的开发方面显得非常务实。在团队看来,AI 应用应当符合商业逻辑

研发烧钱,痛点难解决

很多时候,客户的痛点无法用 AI 解决,但 AI 的研发却是一个烧钱的工作。在实际应用中,如果 AI 应用所减少的成本和效率提升并不足以弥补开发投入,这就使得很多公司望而却步。

比如说,通讯领域可以使用的 AI,如客服和营销等,真正需要解决的是生产问题,如客户通过 AI 得到的客户转换率的提升,而很多时候 AI 并不能解决这些问题。例如,一个人类客服通过自身的能力,每日工作只有八小时,但可以带来的一定催收转化率。而 AI 替代后,尽管能够不间断二十四小时工作,但是由于本身的能力问题,反而可能导致转化率的严重下滑。这就需要开发 AI 产品时充分了解客户需要解决的实际问题。

同时,AI 产品的研发成本目前依然高企。尽管大型企业和头部客户有一定的资金和动力,采用 AI 产品进一步降低成本,但大量的中小企业对此缺乏动力。例如,一个公司本身只有几十人的情况下,采用 AI 无疑是「杀鸡用牛刀」,不具有规模效应。因此,容联的 AI 产品也多面向大型客户。

AI 究竟价值几何

那么,AI 究竟起到了什么作用?怎样看待 AI 实际上的商业价值?容联认为,目前采用 AI 的一个重要原因是要解决市场准入问题。

由于现在有「智能化」、「AI」的产品和企业非常多,因此很多公司的产品如果没有「AI」这一功能。往往会被企业拒之门外。矛盾的一点在于,如果投入很大成本研发,而最终效果并不理想,使得企业没有使用的动力,投入大量成本研发的 AI 就相当于被浪费掉了。

因此,想要兼有 AI 的能力,同时还要让企业真正去使用、用得好,脱离行业发展孤立去看 AI 是行不通的。这也是为什么容联依托在行业内的多年发展,从现有的市场中分析需求,基于已有的产品和方案发展 AI 产品的重要原因。

行业经验成为 AI 应用护城河

当前,AI 行业竞争非常激烈。前有科技巨头的高歌猛进,后有 AI 独角兽的围追堵截。但即使是不同企业的 AI 应用,在技术上都没有和对手拉开代差。这时候,只有洞悉行业发展态势,深刻理解行业需求的企业才更具有优势。

首先,对于通讯行业的了解使得容联在开发相关的 AI 应用时能够和自身已有的产品和解决方案结合,实现打包式的 AI 服务。通讯服务解决方案是一个复杂的问题,除了向客户提供 AI 能力之外,通讯服务商往往还需要解决各个通讯网络、硬件、软件方面技术兼容和数据互通的问题。

在这种情况下,客户更希望的产品往往是产品+AI,而不是 AI+产品。虽然 AI 是为客户提供的方案中的亮点,但这并不是全部。AI 产品的关键在于 AI 和产品内的各个环节和方法充分打通,向客户打包提供智能化的综合解决方案。这样一来,仅提供 AI 能力接口往往并不能满足需求。

此外,不熟悉行业逻辑和方法的企业在推进 AI 能力和行业场景结合的过程中可能也会遇到问题。例如,通讯产品往往需要对多种硬件、接口和数据格式进行适应和兼容。很多时候需要兼容的版本十分老旧,没有行业从业经验很难进入。这样一来,依托现有的成熟产品进行 AI 的扩展和改造就显得更加快捷而成本低廉。这些都是容联在通讯领域内,依托已有基础、稳步发展 AI 的优势所在。
产业容联云计算AI
相关数据
数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

语音合成技术

语音合成,又称文语转换(Text to Speech)技术,是将人类语音用人工的方式所产生,能将任意文字信息实时转化为标准流畅的语音朗读出来,相当于给机器装上了人工嘴巴。它涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,也即让机器像人一样开口说话。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据管理技术

数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其目的在于充分有效地发挥数据的作用。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

情感计算技术

情感计算(也被称为人工情感智能或情感AI)是基于系统和设备的研究和开发来识别、理解、处理和模拟人的情感。它是一个跨学科领域,涉及计算机科学、心理学和认知科学(cognitive science)。在计算机领域,1995年Rosalind Picard 首次提出affective computing。研究的目的是使得情感能够模拟和计算。这个技术也可以让机器人能够理解人类的情绪状态,并且适应它们的行为,对这些情绪做出适当的反应。这是一个日渐兴起的兴欣领域

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

数据迁移技术

数据迁移(又称分级存储管理,hierarchical storage management,hsm)是一种将离线存储与在线存储融合的技术。它将高速、高容量的非在线存储设备作为磁盘设备的下一级设备,然后将磁盘中常用的 数据按指定的策略自动迁移到磁带库(简称带库)等二级大容量存储设备上。当需要使用这些数据时,分级存储系统会自动将这些数据从下一级存储设备调回到上一 级磁盘上。对于用户来说,上述数据迁移操作完全是透明的,只是在访问磁盘的速度上略有怠慢,而在逻辑磁盘的容量上明显感觉大大提高了。

查询技术

一般来说,查询是询问的一种形式。它在不同的学科里涵义有所不同。在信息检索领域,查询指的是数据库和信息系统对信息检索的精确要求

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

推荐文章
暂无评论
暂无评论~