Auto Byte

专注未来出行及智能汽车科技

微信扫一扫获取更多资讯

Science AI

关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展

微信扫一扫获取更多资讯

从阿里达摩院十大科技趋势预测,看人工智能企业发展路径

认知智能的发展离不开自然语言处理和知识图谱,因此掌握这两项核心技术的企业,自然能获得更大的价值。

日前,阿里巴巴达摩院对外发布2020年十大科技趋势,“人工智能感知智能向认知智能演进”这一趋势位列榜首。

何为感知智能与认知智能?

业内普遍认为,人工智能的主要发展方向包括运算智能、感知智能、认知智能:

运算智能,主要指快速计算和记忆存储能力。

感知智能,即视觉、听觉、触觉等感知能力。人和动物都具备,能够通过各种智能感知能力与自然界进行交互。例如,自动驾驶是通过激光雷达感知设备和人工智能算法进行驾驶信息计算,人脸支付是设备通过感知人脸数据信息进行身份确认。机器在感知世界方面的优势在于主动感知,因为机器可以充分利用DNN和大数据的成果。

认知智能,即“能理解会思考”,拥有处理复杂的事实和情形的能力。认知智能的发展分为三个层次:第一层是语言理解;第二层是分析、推理;第三层是人格和情感。

感知智能发展到认知智能的必要性

达摩院发布的趋势报告指出,人工智能已经在“听、说、看”等感知智能领域达到或超越了人类水准,但在需要外部知识、逻辑推理或者领域迁移的认知智能领域还处于初级阶段。而认知智能,则是未来人工智能热潮能否进一步打开天花板,形成更大产业规模的关键因素。

以公安行业为例,人脸识别只是让机器能够识别出身份,但是涉及到侦查、破案,就需要梳理大量的线索,推断出可能的结果,这仅靠感知智能是无法完成的。

认知智能的出现,使得人工智能系统不再只是简单的数据统计拟合,而是主动了解事物发展的背后规律和因果关系。认知智能可以帮助机器跨越模态理解数据,学习到最接近人脑认知的“一般表达”,获取类似于人脑的多模感知能力,进而带来颠覆性的产业价值。

感知智能到认知智能的进阶路径

达摩院认为,认知智能将结合自然语言处理、跨领域知识图谱因果推理、持续学习等技术,建立稳定获取和表达知识的有效机制,让知识能够被机器理解和运用,进而实现感知智能到认知智能的关键突破。

自然语言处理技术和知识图谱是认知智能阶段技术发展的基石。在这个大趋势下,率先布局自然语言处理知识图谱的企业将在认知智能时代具备强大的竞争力。

机器的学习需要基于文本进行,但机器对文字的理解存在巨大的技术难度,文本在不同场景中的处理方式也不尽相同,文本中蕴含的价值一直难以得到有效利用。自然语言处理技术的作用,通俗地说,就是把自然语言转化成机器能够理解的符号,构建机器理解知识的基础。当攻克的自然语言识别后,才可以将不同行业的数据连接起来,甚至将线上和线下的数据打通,为人工智能构建知识库做准备。

认知智能的发展离不开自然语言处理知识图谱,因此掌握这两项核心技术的企业,自然能获得更大的价值。

国内认知智能布局情况及发展现状

目前市场上,认知智能技术的公司更多是基于自身业务转型,主要可以分为两大类别,一类是从大数据分析公司转型,如明略科技、百分点等;另一类是语音或者语言声学的公司,如科大讯飞思必驰云知声快商通等,这类公司大多以语音识别、声纹识别为主。

例如,科大讯飞感知智能+认知智能为企业的主要研究方向。其感知智能的目标是,实现高可用的感知智能,让机器有更多感知能力;任务包括语音识别、手写识别、图像识别等。认知智能的目标是,实现认知智能的突破,部分取代人类的脑力劳动;其任务包括智能客服、自动阅卷、人机交互等。另一家中国AI企业快商通,以声纹识别等智能生物识别技术建立感知智能“智能生物识别大脑”,以自然语言处理等技术建立认知智能“艾赋能大脑”,其目标是希望机器能够以语音和语言为入口,通过认知智能训练出不同领域的专家系统,进而赋能到整个社会。

感知智能出现乏力时,认知智能的出现可以将产业升级拉到快车道。如今技术壁垒还在攻克,通用的认知智能技术尚不可应用在各行各业,但在细分领域,认知智能已经能够商用落地。

在公安领域,认知智能通过对犯罪者行为特征进行提取和模式分析,并可以开发出一套犯罪预测的AI模型,一定程度上提高社会安全事件的预警能力和对风险态势的感知。落地案例可参考快商通声纹综合作战平台、明略数据大数据研判系统等。

image/20200104/29fe9efe1cc89cd5a8d2e9399c610a3f.jpeg

快商通
快商通

人工智能独角兽企业快商通,掌握自然语言处理、知识图谱、声纹识别、语音识别等技术的自主原创能力,通过将AI、BI引擎技术应用于客服云、销售云、营销云、安全云等产品中,赋能用户实现产业营销智能数字化升级。

产业认知智能感知智能达摩院
相关数据
科大讯飞机构

科大讯飞股份有限公司成立于1999年,是亚太地区知名的智能语音和人工智能上市企业。自成立以来,长期从事语音及语言、自然语言理解、机器学习推理及自主学习等核心技术研究并保持了国际前沿技术水平;积极推动人工智能产品研发和行业应用落地,致力让机器“能听会说,能理解会思考”,用人工智能建设美好世界。2008年,公司在深圳证券交易所挂牌上市。

http://www.iflytek.com
快商通机构

快商通是一家以人工智能、大数据技术为核心的原创AI企业,中国标准化研究院人工智能标准基地唯一合作单位,厦门市人工智能行业协会会长单位。拥有人工智能领域国内外在申及授权专利400余项。在智能生物声纹识别、自然语言处理等技术领域具有国际领先性,赋能公检法、金融、医疗、食健、智慧生活等领域,有丰富的工程化经验和成功案例。服务了公安一所、国家电网、平安集团、阳光保险集团、上海华瑞银行等。技术团队以李海洲教授领衔,来自声学所、新加坡国立大学、清华大学、厦门大学、剑桥大学等众多硕博士。

https://www.kuaishang.cn
思必驰机构

思必驰是国内领先的对话式人工智能平台公司,拥有全链路的智能语音语言技术,自主研发了新一代的人机交互平台(DUI),和人工智能芯片(TH1520);为车联网、IoT、以及众多行业场景合作伙伴提供自然语言交互解决方案。 思必驰拥有上千项知识产权,是国际上极少数拥有自主知识产权、中英文综合语音技术的公司之一;与阿里、腾讯、小米、富士康、OPPO、长虹、顺丰、龙湖地产等企业达成战略合作;旗下人工智能产业基金累计投资20+家生态企业。

http://www.aispeech.com/
云知声机构

云知声专注于物联网人工智能服务,是一家拥有完全自主知识产权、世界顶尖的智能语音识别、语义理解等技术的高新技术企业,总部位于北京,在上海、深圳、厦门、合肥设有子公司。公司员工500余人,核心研发团队近百人,其中 45% 拥有博士学历,工程师占比78%,拥有雄厚的科研和产业化实战能力。 云知声深入探索感知智能、认知智能、通用智能三大方向,在语音、语言、知识计算、大数据分析、人工智能芯片等领域建立了领先的核心技术体系,以此构建了完整的人工智能技术图谱。并率先在国内布局大规模异构并行超算平台 Atlas 和深度学习计算框架 UniFlow ,以领跑行业发展的技术实力,助力 AI 基础设施建设,服务国家 AI 战略。 基于“云、端、芯”技术产品体系,提供跨平台、跨场景,融合云端智能和本地智能一体化的 AI 系统解决方案,已在 AI 生活(家居、车载等)和 AI 服务(医疗、教育、政务、金融等)两大核心场景广泛落地。 目前合作伙伴数量已超过 2万家,覆盖用户已超过 2亿,日调用量超 4亿次,其中语音云平台覆盖的城市超过 647个,覆盖设备超过 1 亿台。 云知声自 2012 年成立以来,发展迅猛,备受人工智能行业及资本市场关注,累积融资数亿美元,并多次创下AI语音领域单轮融资记录。云知声连续两年入选福布斯中国最快科技成长公司 50 强企业,是中国人工智能行业成长最快的创业公司之一 。

https://www.unisound.com/
激光雷达技术

自动驾驶车辆传感器的一种,采用激光扫描和测距来建立车辆周围环境的详细三维模型。Lidar 图像具有高度准确性,这使得它可以与摄像头、超声波探测器和雷达等常规传感器相提并论。然而激光传感器面临体积过大的问题,同时,它的机械结构非常复杂。

数据分析技术

数据分析是一类统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。其他一些用于收集数据,以便弄清哪些是同质的,从而更好地了解数据。 数据分析可以处理大量数据,并确定这些数据最有用的部分。

专家系统技术

专家系统(ES)是人工智能最活跃和最广泛的领域之一。专家系统定义为:使用人类专家推理的计算机模型来处理现实世界中需要专家作出解释的复杂问题,并得出与专家相同的结论。简言之,如图1所示,专家系统可视作“知识库(knowledge base)”和“推理机(inference machine)” 的结合。

因果推理技术

基于因果关系的一类推理方法,是一种常见推理模式,涉及观察到的共同效应的原因的概率依赖性。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

逻辑推理技术

逻辑推理中有三种方式:演绎推理、归纳推理和溯因推理。它包括给定前提、结论和规则

知识库技术

知识库是用于知识管理的一种特殊的数据库,以便于有关领域知识的采集、整理以及提取。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括基本事实、规则和其它有关信息。

知识图谱技术

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(Heterogeneous Information)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力。 知识图谱这个概念最早由Google提出,主要是用来优化现有的搜索引擎。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入Bill Gates的时候,搜索结果页面的右侧还会出现Bill Gates相关的信息比如出生年月,家庭情况等等。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

自然语言处理技术

自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

明略科技机构

明略科技是领先的全球企业级数据分析和组织智能服务平台,致力于通过大数据分析挖掘和认知智能技术,推动知识和管理复杂度高的大中型企业进行数字化转型。 明略科技企业智能决策平台,通过连接企业中的人与机器,不断积累组织知识资产并将其程序化,最终实现具有分析决策能力的高阶人工智能应用,让组织内部高效运转,实现人机同行的美好世界。

www.mininglamp.com/
阿里巴巴机构

阿里巴巴网络技术有限公司(简称:阿里巴巴集团)是以曾担任英语教师的马云为首的18人于1999年在浙江杭州创立的公司。

https://www.alibabagroup.com/
暂无评论
暂无评论~