肩扛人工智能国家队,云从科技这一年的「进」与「守」

「国家队」标签已经成为人工智能等高壁垒行业拿单、拿地的「背书」,但「国资」的引入仅仅只是为了扫清业务上的障碍、获得更多政策扶持? 事实上,要以「国家队」自居,荣誉背后还有一份同等重量的责任,「守」与「进」同样重要。

「肩上的担子越来越重了」,云从科技创始人兼总裁周曦私下里谈道。

彼时,他刚从国家发改委手里接过国家「互联网+」重大工程——「人工智能基础资源公共服务平台」建设的重任,并获得广州市政府 20 亿元的资金支持,正奔波于中美两地召集全球顶级的技术与管理人才。周曦和云从团队深知,「位置越核心,责任越重大。」

过去一年里,云从在保证银行、民航、安防等业务的领先性同时,各地团队还在有条不紊地推进国家级项目工程——「人工智能基础资源公共服务平台」、「高准确度人脸识别系统产业化及应用项目」两大建设任务。

如今,重担之一已经落地。据机器之心了解,云从承建的「人工智能基础资源公共服务平台」将在本月正式发布。此外,云从的融资和 IPO 进程也获得了阶段性进展。

机器之心消息,云从科技正式完成 B+轮融资。包含该轮融资在内,云从科技已完成四轮融资,累计获得发展资金超过 35 亿元人民币。

该轮融资中,除元禾原点、越秀金控,刘益谦等原有股东继续跟投外,新增诸多国家战略投资者,包括中国国新、广州产业投资基金、广东粤科金融集团、上海联升资本、渤海产业投资基金等。

据产业内人士透露,云从科技该轮估值预计达到 230 亿人民币。新一轮融资被外界视为 IPO 前奏,目的是为建立估值,并拓宽投资者基础。

事实上,「中国速度」从来没有让人失望,尤其是在人工智能技术「跑马圈地」抢着落地的这一年,人工智能头部公司与资本的绑定越来越深,不乏淡马锡、软银等国际顶尖财团的身影。但资本加速实现的「快」并不意味着「稳」,相比同类型的原创型 AI 技术平台公司,完全脱胎于中科院科研机构的原生「国家队」似乎对于资本积累和市场扩张之路想得更深,走得也更为稳健。

「我们是一家纯内资的公司」——周曦在创立云从之初便坚持的理念自始未曾动摇,「云从的自主关键技术、资本结构都是清晰的」,纵使过去两年里资本对于人工智能的热情大起大落。换言之,在这波人工智能浪潮中,云从科技为原创型人工智能技术和海量数据保留住了更多的国家自主权,也为部分涉及国家安全层面的安防和金融领域项目筑起了屏障。

面对同一梯队的人工智能公司日趋同质化的问题,周曦谈道,“很多时候,同质化也意味着大家做的事还浮于表面。”技术方案公司只靠提供核心技术,确实非常容易同质化。集成商控制着大盘子,需要买技术时大家一拥而上,这样并不能长久。

一、接下「重担」

云从科技创立背后的关键人物,从左往右依次是创始人周曦、中国工程院外籍院士黄煦涛、中国科学院重庆绿色研究院负责人袁家虎

21 世纪初,机器的图像识别率开始超过人眼,计算机视觉技术的商业化进程初露希冀。

还在 UIUC(伊利诺伊大学厄巴纳-香槟分校)进行图像识别研究的周曦对于技术落地的构想愈发强烈。「我和 Thomas 时常讨论一些更贴近实用的东西,将图像视频的基础理论用在什么地方更合适」。在芬兰等地考察时,一些前沿应用案例让周曦受到启发,同时也坚定了人脸识别技术的应用方向,并且认为中国市场具有可观存量。

Thomas S. Huang 是周曦博士期间的导师,中文名为黄煦涛,他发明了预测差分量化(PDQ)的两维传真(文档)压缩方法,是计算机视觉模式识别、多媒体等领域最资深的华人科学家之一,被称为「计算机视觉之父」,他为后来云从的创立及中美两地人工智能技术的交流起到了重要作用。

2011 年受邀回国,周曦进入「中国科学院百人计划」,联合 UIUC 及新加坡国立大学,首先在中国科学院重庆研究院建立了智能多媒体技术研究中心。这座研究中心扮演者牵线搭桥的作用,将 UIUC 的先进技术逐步移植到国内,并与中科院此前研究成果进行融合。

之所以选择创业,而不是背靠大公司做研发。周曦表示,在硅谷文化里,真正的创新都是小公司在做,大公司在思想上反而相对保守。在他看来,既然要做创新的事,就应该更加彻底和投入。

在互联网时代创立科技公司首选是北上广深,云从选择重庆——很大程度上是「背后的人」推动。「当时是袁院长的诚意打动了我们」,周曦回忆。这里提及的袁院长就是中科院重庆研究院负责人,据周曦介绍,他曾三次专门飞到美国,为的就是与黄院士商讨把领先技术带回国的方案。在后来的云从成立过程中,中科院作为天使轮投资方。

中科院重庆研究院为云从创立之初便孕育了充足人才和技术成果。随后,云从的科研力量逐渐壮大,分别在重庆、成都、上海、苏州、广州建立了五大研发中心,中科院、上海交大两个联合实验室,及美国 UIUC 和硅谷两个前沿实验室组成的三级研发架构,研发人员达到 700 多人,并在广州南沙建立全球领先的 AI 视觉图像创新研发中心。

技术长期与厚实的积累决定了云从的商业化节奏。成立半年内,云从便推出了多项行业应用级产品及解决方案,积极打造自主品牌,逐步在金融、安防、安检等主流市场形成牢固的领先市场地位,并不断拓宽市场边界。

2017 年 3 月,云从科技从国家发展改革委手中接过 2017 年「互联网+」重大工程拟支持项目名单,云从科技与百度、腾讯、科大讯飞等 22 家重点科技公司及项目并列其中。

云从科技获得拟支持的项目为公司旗下的「人工智能基础资源公共服务平台」项目,项目名称中显示出入选项目的基础性、标准化等特征。周曦谈到该平台项目时表示,最重要的是获得政策支持,然后可以与各个公共机构建立合作,合规的利用数据为普通民众服务;强化战略布局,真正让人工智能快速进入各行各业与平常生活。

对于「人工智能基础资源公共服务平台」的具体定义,2016 年 12 月,国家发改委发布的《发展改革委实施新一代信息基础设施建设工程等的通知》(以下简称「《通知》」)中曾提到:搭建新型超大规模计算机集群,面向语音、图像、地理等信息,集成音频、视频、图片、三维模型、地理信息等格式数据,建设面向全行业应用的人工智能基础资源数据库,支持云端智能分析处理,具备数据自动标签、智能分类功能,能够提供人脸识别、文字识别、在线语音识别等辅助分析功能,为人工智能生态体系开发与建设提供基础性、公共性服务。

通俗来说,所谓人工智能基础资源公共服务平台,即集成了大量的音频、视频、图片等格式数据,形成一个全行业可用的基础资源数据库,平台能支撑云端分析,提供人脸识别、文字识别、在线语音识别等功能。

《通知》中还明确对平台的数据和技术能力提出了明确的技术要求。比如:(1)平台数据容量不低于 5PB,形成不少于 500 万条的标准化数据资源,形成不少于 500 万条的标准化数据资源,基于图像、语音类应用日均调用次数超过 1 亿次。(2)编制不少于 2 项智能化处理数据标签、智能分类标准,搭建资源入库的评测评价平台。(3)图像识别率超过 93%,文字识别率(中文)达到 90%,在线语音识别率超过 95%。

据机器之心了解,云从科技的「人工智能基础资源公共服务平台」项目已经获得正式批复,将于本月正式发布。

2018 年 1 月,国家发改委再次确定云从科技和公安部一所旗下的「北京中盾」承担国家「人工智能」重大工程——「高准确度人脸识别系统产业化及应用项目」建设任务。

至此,在市场需求与国家政策扶持的双重杠杆撬动下,云从科技作为一家计算机视觉技术型公司的技术和市场潜力被极大地挖掘,走向成熟的平台型和商业化蜕变。

今年 6 月,国际著名投资论坛 Nanalyze 结合 Crunchbase 和 CB Insights AI Top 100 数据,公布了世界上十大人工智能初创公司的名单,云从科技作为中国唯一的内资企业代表入选。

二、多领域快跑

云从城市大脑中控平台
在云从的业务线中,银行和机场、安防最为清晰。据介绍,云从已成为银行业人脸识别技术最大供应商之一,包括农行、建行、中行、招行总行等全国 400 多家银行已采用公司产品,为全国银行提供对比服务日均 2.16 亿次。

在安防领域,公司产品已在 29 个省级行政区上线实战,截至 2018 年 3 月份已协助各地警方取得 4376 个案例战果,获得公安部高度认可;在民航领域,已有 54 家机场选择云从产品。

当技术型公司的差异化逐步缩小,围绕难点技术的攻克便成为核心竞争力之一,云从科技对比没有懈怠。

今年,云从打破三项世界记录,同时在 Market-1501,DukeMTMC-reID,CUHK03 三个数据集刷新了世界记录,其中最高在 Market-1501 上的首位命中率(Rank-1 Accuracy)达到 96.6%,让跨镜追踪(ReID)技术在准确率上首次达到商用水平,让计算机视觉由「认脸」进化到「识人」。

跨镜追踪(Person Re-Identification,简称 ReID)技术是现在计算机视觉研究的热门方向,与人脸识别技术类似,主要解决跨摄像头跨场景下行人的识别与检索。该技术能够根据行人的穿着、体态、发型等信息认知行人,与人脸识别结合能够适用于更多新的应用场景,将人工智能的认知水平提高到一个新阶段。

行人的数据获取难度远远大于人脸数据获取难度,而行人的信息复杂程度又远远大于人脸,这两个因素叠加在一起使得 ReID 技术的算法研究变得更加困难,也更加重要。例如光线、遮挡、图片模糊等客观因素。另外,行人的穿着多样,同一人穿不同的衣服,不同的人穿相似的衣服等等也对 ReID 技术提出更高的要求。

当 iPhone X 让「刷脸解锁」第一次在移动端规模化使用,非接触式生物识别技术开始在 C 端市场真正爆发。面对当下 3D 结构光技术成熟度与市场需求不匹配的情况,云从科技顺势在今年推出 3D 结构光人脸识别系统。该套系统基于「飞龙 II」深度学习结构光算法与 3D 结构光深度摄像头。据介绍,其准确率在千万分之一误识率下达 99% 以上,速度由 1-2 秒缩短至毫秒级,此外,更能防御面具、视频等欺诈手段。

云从科技研究院副院长周翔介绍,云从科技从 2015 年成立之初后的几个月便开始研究 3D 方面的技术,到 2015 年 9-10 月份便开始成立结构光研发项目,随后拜访国内一些做结构光的实验室或公司,了解结构光算法和知识,进行技术储备。

科技以人为本,通过人脸识别技「寻人」已不是新闻,但基于模糊数据「隔代寻亲」让技术增添了更多人情味。在《机智过人》第二季第五期的央视竞技节目中,继去年在模糊影像挑战神笔警,云从科技联合创始人姚志强这次带来的人脸识别技术「御眼重明 2.0」将采取结构光的技术挑战跨代的辨识能力,即通过祖辈寻找孙辈。

据介绍,人工智能技术「御眼重明 2.0」在隔代直系亲属的识别中,父母与孩子之间的识别率大约是 74%~80%,而祖孙跨代,识别率最高为 78.16%,最低是 19.14%。

节目现场,「御眼重明」和崔娟警官需要通过给定的 4 个孩子模糊的面部拓本,和整个合唱团成员的面部进行分析比对,并找出 4 位孩子的祖辈。挑战双方最终都完成了任务,但「御眼重明 2.0」技术通过大样本的数据学习和优化的算法匹配跨越 3 代的祖孙俩,以更快的识别速度获得了最后的胜利。

据了解,云从科技姚志强团队在研发过程初期,研究人员非常难以在隔代遗传中找到相对应的相似点。为客服遗传学中的诸多不确定因素,云从科技姚志强团队对人脸进行区块分割。让人工智能只是对某一器官进行隔代遗传的分析,最终找到了隔代人长相之间的逻辑关系。

此外,云从还采取合作模式,把核心模块集成到机器人、教育、智慧社区等领域。谈及与银行、安防业务的区别,周曦强调,重要的业务线要保证拥有自己的最终客户,认可云从的品牌,所以在银行、安防领域会坚持直销模式。

2018 年,云从科技客户和业务量较之前实现了数十倍的增长,为超过 1217 家客户的「AI+」升级,多领域快跑,成为中国自主人工智能技术产业化的领军者之一。

三、深化「AI 产业」

云从科技联合中科院成立了人工智能大学,为四大行员工进行人工智能相关技术与产品培训

「在我们看来,金融实际上是打通其他各行各业的一个关键环节,透过支付能把各行各业连接起来。」周曦谈起云从对于金融市场需求进一步挖掘时谈到。聚焦在金融服务产业,云从想做的事不只有人脸识别,还有更为深远的愿景。

在和数千位银行客户交流后,周曦认为,零售讲究「坪效」,银行也希望提升网点的业务效率,更好地营销产品和服务。我们深入到银行的各个环节,比如征信、营销、风控、流程优化、成本控制等,将 AI 技术与这些环节结合,为产业服务。比如,以前老百姓向银行递交房屋贷款,可能要三五天后才知道结果,以后这个效率会大幅提升。

截止 2018 年 3 月 15 日,国内有能力自建系统的银行约为 148 家,已经完成招标的银行约为 121 家,其中云从中标了 90 余家总行平台,市场占有率约为 72.7%。在网点覆盖方面,云从的客户已经覆盖了超过 14.7 万个网点,约占比例为 66.8%,日均调用量超过 2.16 亿次。但这只是云从「智慧厅堂」方案中的一个部分。

周曦表示,我们要帮助银行将线下网点打造成集营销、产品展示、客户体验为一体的中心。我认为,线下网点是银行要用活的资产,而不仅仅是存取现金的地点。

今年 7 月,云从科技与兴业数金合作,覆盖超过 300 家无自建平台能力的小型银行。此外,云从科技联合中科院成立了人工智能大学,在全国各地银行机构巡回交流上课,银监会、四大行及其分行都参与其中,一起讨论学习,成为专门针对行业进行「市场培育」的组织。

为建立真正的人工智能基础资源平台,云从科技正在打通边缘计算与后台计算数据平台。在前端完成智能感知人机交互、辅助决策后,交由云端进行智能决策、数据挖掘、预测干预。

云从科技联合创始人姚志强介绍并展示了云从科技边缘计算领域的多项前沿技术与解决方案,包括炬眼识别相机、人证合一终端、人脸抓拍相机等。智能识别相机全面分析处理实时画面,识别出人脸后将「人脸图像」转变为「特征数据」,这些特征数据将每秒兆级的视频资料转化为千分之一的数据,再传回中央系统。

2018 年 9 月 14 日,国家工信部正式公布 2018 年人工智能与实体经济深度融合创新项目名单,其中云从科技「基于自研 Soc 芯片的高准确度人脸识别产业化应用」入选核心基础项目名列。

本次工信部通知中提到了三个关键词,一个是人工智能,一个是实体经济,再一个就是创新,前几年工信部提出的是工业化与信息化的融合,本次的通知可以看出,其方向更加的聚焦,那就是人工智能和 2025 中国制造。

云从科技联合创始人姚志强在接受采访时表示,这次国家工信部项目是 2018 年国家发改委「高准确度人脸识别系统产业化及应用项目」的延伸和配套,主要打造面向终端设备的人脸识别标准模块,通过 AI 芯片让更多终端设备标准化智能化。

对于是否会在近期推出自研 AI 芯片,云从科技联合创始人姚志强谈道,芯片是一个系统工程,云从会基于自身优势自研其中的核心组件,而非全部,云从能够让更多的 IC 合作伙伴参与进这项国家项目。

四、云从的坚守

三年前,八名在视觉领域的领军研究者带着满怀的自信从中科院集体辞职创业,成就了当下「纯内资」的人工智能国家队——云从。

「就是希望人工智能能够落地」,34 岁的周曦谈起从博导走向创业者背后的初衷时说,「这就像我们的小孩,现在还出于高速发展阶段,只有我们自己亲自让它落地才是最好的方式。」

三年过去了,历经四轮融资,云从在快速成长的同时,仍没有忘记「守住」自己的根系与血脉,坚持采取非VIE架构和「内资」引进模式。

不可否认,「国」字头投资人及「国家队」标签已经成为在高壁垒行业拿单的「背书」。有人工智能独角兽公司联合创始人表示,toG 项目很多时候需要一块敲门砖。敲门砖意味着有人能把你带进去,让你有机会在客户面前呈现你的产品和服务,但最后能不能拿下项目,还要看你的工作。

但是,站队「国资」是否只是为了拿到敲门砖?

周曦表示,云从的核心优势是能够为银行、为安防提供切实可行的解决方案,而不是背景。就团队的行事风格而言,云从采取合作一个行业就深入其中的做法,而不是蜻蜓点水。无论是金融,还是安防,云从希望带动整个产业链条的智能升级,成为人与行业交互的接口。

产业云从科技融资
相关数据
科大讯飞机构

科大讯飞股份有限公司(SZ.002230)成立于1999年,是一家专业从事智能语音及语言技术、人工智能技术研究,软件及芯片产品开发,语音信息服务及电子政务系统集成的国家级骨干软件企业。科大讯飞的语音合成、语音识别、口语评测、机器翻译等智能语音与人工智能核心技术代表了世界最高水平。

http://www.iflytek.com/
云从科技机构

云从科技是从中国科学院孵化的人工智能企业,专注于人脸识别等计算机视觉技术研发。核心技术源于四院院士、计算机视觉之父——Thomas S. Huang 黄煦涛教授。研发团队曾于2007年到2016年7次斩获智能识别类世界大赛冠军。云从科技作为中国科学院战略性先导科技专项的唯一人脸识别团队,参与了人脸识别国标、部标、行标起草与制定; 2017年2月,云从科技入选国家发改委重大工程,与百度、腾讯、科大讯飞共同负责人工智能公共平台建设。

http://www.cloudwalk.cn/
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

人脸识别技术

广义的人脸识别实际包括构建人脸识别系统的一系列相关技术,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等;而狭义的人脸识别特指通过人脸进行身份确认或者身份查找的技术或系统。 人脸识别是一项热门的计算机技术研究领域,它属于生物特征识别技术,是对生物体(一般特指人)本身的生物特征来区分生物体个体。

边缘计算技术

边缘运算(英语:Edge computing),又译为边缘计算,是一种分散式运算的架构,将应用程序、数据资料与服务的运算,由网络中心节点,移往网络逻辑上的边缘节点来处理。边缘运算将原本完全由中心节点处理大型服务加以分解,切割成更小与更容易管理的部分,分散到边缘节点去处理。边缘节点更接近于用户终端装置,可以加快资料的处理与传送速度,减少延迟。在这种架构下,资料的分析与知识的产生,更接近于数据资料的来源,因此更适合处理大数据。

模式识别技术

模式识别(英语:Pattern recognition),就是通过计算机用数学技术方法来研究模式的自动处理和判读。 我们把环境与客体统称为“模式”。 随着计算机技术的发展,人类有可能研究复杂的信息处理过程。 信息处理过程的一个重要形式是生命体对环境及客体的识别。其概念与数据挖掘、机器学习类似。

计算机视觉技术

计算机视觉(CV)是指机器感知环境的能力。这一技术类别中的经典任务有图像形成、图像处理、图像提取和图像的三维推理。目标识别和面部识别也是很重要的研究领域。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

准确率技术

分类模型的正确预测所占的比例。在多类别分类中,准确率的定义为:正确的预测数/样本总数。 在二元分类中,准确率的定义为:(真正例数+真负例数)/样本总数

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

人机交互技术

人机交互,是一门研究系统与用户之间的交互关系的学问。系统可以是各种各样的机器,也可以是计算机化的系统和软件。人机交互界面通常是指用户可见的部分。用户通过人机交互界面与系统交流,并进行操作。小如收音机的播放按键,大至飞机上的仪表板、或是发电厂的控制室。

推荐文章
暂无评论
暂无评论~