天壤智能完成1.8亿元A轮融资,成立「城市大脑实验室」

2018年8月6日,天壤智能宣布完成1.8亿元A轮融资,由招银国际和高榕资本共同领投,紫牛基金和挖财科技跟投。天壤智能曾于2016年获得高榕资本领投、金狄投资跟投的天使轮融资。

天壤智能成立于2016年6月,由前阿里云资深总监、阿里妈妈首席数据科学家薛贵荣博士创办,创始团队来自于微软、IBM、百度和阿里巴巴等互联网领军企业。两年时间里,天壤智能已将AI技术与服务应用于商业营销、城市交通领域,正探索在金融和教育领域应用场景中落地。薛贵荣表示,天壤希望通过深度学习强化学习机器学习等技术推动人工智能技术的发展,赋能更多行业,让通用人工智能像水电煤一样成为社会的基础设施。

天壤宣布A轮融资完成的同时,也宣布成立「城市大脑实验室」,将加速机器智能在城市大脑多个场景的深入研究与落地。「城市大脑实验室」目前由宾夕法尼亚州立大学(Penn State University)终身教授黎珍辉博士领衔。黎珍辉博士一直从事超大规模时空大数据挖掘技术研究,特别是针对城市数据、环境数据和地理数据方面的研究,研究项目大多数与交通学家、 社会学家、犯罪学家以及地理学家紧密合作。黎珍辉博士于2012年获得University of Illinois Urbana-Champaign计算机博士学位,师从Jiawei Han教授,在过去的10多年发表了多篇高质量国际学术论文和专著,并担任人工智能国际期刊《ACM TIST》和《DMKD》的副主编,并在数据挖掘领域顶级会议KDD上主持城市计算(Urban Computing)相关论坛。

专注博弈决策智能

2016年AlphaGo战胜李世石成为一记惊雷,人工智能技术再次被引爆,薛贵荣从中意识到人工智能能够变成一种产业,成为一种强大的能力服务于人类,于是从阿里离开,创办了天壤智能。在多数人工智能初创企业都以图像识别、语音识别、自然语言理解等感知和认知智能技术为主攻方向时,天壤选择了更有挑战性的方向——博弈决策智能。

博弈决策具有非常大的不确定性,博弈场景非常动态,其问题边界很难罗列完全。在当下能够解决问题的策略,在时间和空间变化时,可能不会起作用,甚至是反作用。在一些基于海量数据进行实时决策的场景,人力很难完成大量计算,实现最及时和最准确的决策。在这样的场景下,机器智能可以实现比人更优的决策。

围棋则是博弈下连续决策的典型场景。围棋的下法十分复杂,棋盘有10的170次方种变化,很难找到边界。每一步棋都可能给局面带来巨大变化,走错一步就可能导致全盘皆输。而计算每一步盘面的优劣则更是一个艰巨的计算任务,在短短几十秒内,很难将后续所有可能的变化一一枚举。

天壤创始团队从围棋AI这个极具挑战性的应用场景开始攻坚技术。凭借团队成员多年在机器学习、人工智能领域的实战经验,经过一年多的研发,天壤智能的围棋系统已经超越了世界冠军的水平。在今年5月举办的2050大会上,天壤智能与世界冠军朴廷桓进行了一场人机赛,天壤围棋AI胜出。

人工智能战胜围棋世界冠军并不让人意外,真正令人惊叹的是天壤作为一家仅成立两年的创业公司,在远低于科技巨头算力资源的情况下,其背后的智能系统架构——天壤智能搭建了完整的深度强化学习平台。

在该平台上,AI可以实现不断自博弈、提升棋力,这过程中调度硬件资源及异常处理都交由平台自动处理。同时,天壤智能研发出了迭代升级神经网络技术,先从小网络开始训练模型,再逐步切换到更大的网络。在更快的迭代速度下,实现非常深的神经网络训练。这项技术使得天壤智能仅用大公司1/100的计算资源,便达到了世界顶尖的AI棋力。因此,在与世界冠军朴廷桓对弈时,天壤AI仅仅使用CPU进行运算,而这样的棋力,以前只能使用大量GPU的运算能力才能达到。

多应用场景全面落地

经过两年多的研究和实践,天壤已经掌握了一套具有自我学习和修正能力的智能方法论。天壤的核心智能表达形式犹如从一个0岁的孩子起步,通过拥有的智能大脑,在日常的学习、积累中一步步成长强大,不断迭代升级,变得更加智能,也只有这样的智能才能够适应更多行业场景。事实上,天壤智能正将其先进的智能引擎应用到多个行业领域中。

在商业营销领域,天壤智能研发出了天钻、天车、天通等多款在线营销智能优化产品,帮助商家在阿里智钻、阿里直通车、腾讯广点通等多个在线广告平台实现智能营销。在营销场景中,不同日期、不同时段、对不同的受众,效果会有巨大的差异,再加上各项商业活动周期,商家往往由于不能及时准确地调整营销操作方案,而导致无法实现最优效果。

据了解,天壤智能已经为数百家商家提供了智能营销服务。通过天壤营销产品,天壤智能的客户,在今年618电商大促活动期间,获得平均58%的营销效果提升。大幅降低了商户的运作成本,并带来大幅交易额提升。

天壤智能也正将决策智能引擎应用到在“城市大脑”场景中。“城市大脑”的提出者王坚博士认为:“城市大脑是机器智能的登月计划。今天所有的人工智能都是在讲怎么让机器传感器模仿人做的事情,而当你了解城市挑战的时候,你就会发现实际上今天城市所有的问题都不是人的智能可以解决的。”

天壤智能也正参与到“城市大脑”的研发中,其中一个项目就是为了解决城市拥堵的问题。交通拥堵已成为困扰城市发展的一大难题,通过智能控制交通信号灯来缓解拥堵变得日益重要。跟围棋一样,交通信号灯控制也是一个基于海量数据进行连续决策的问题,除了考虑局部路况外,还需要考虑整座城市的全局状况,数万个交通信号灯的每一次调整变化,都会对全城交通流量产生影响,复杂度不言而喻。这些困难点正是天壤一直投入研发的博弈决策智能技术最擅长解决的问题。

在金融和教育领域,天壤智能也正在进行同样的应用场景落地的探索。

招银国际资本首席投资官王红波表示:“天壤智能是国内从事机器决策智能最优秀的团队,通过优异的算法和AI引擎将复杂的机器决策智能对算力的要求降低到可以大范围商用的地步,同时机器决策智能本身可以解决更复杂的大空间高频决策问题,突破了单纯做人力替代的逻辑,延伸了AI的想象空间。同时,薛总团队技术和商业的结合能力令人印象深刻。”

高榕资本创始合伙人岳斌表示,“2016年,我们有幸认识了天壤创始团队,第一次见面从下午3点一直聊到晚上9点,聊了6个小时,很佩服薛老师对AI技术趋势的思考。天壤致力于探索人工智能的边界。过去两年,天壤开发了一套深度强化学习平台,并将其应用到围棋、营销等领域,同时还在探索更多的行业场景。”

薛贵荣介绍,天壤的长远规划是打造通用人工智能平台,以AI技术赋能更多的行业和场景,让人工智能成为像水电煤一样的基础设施。

产业薛贵荣城市大脑融资天壤智能创业公司
相关数据
深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

深度强化学习技术

强化学习(Reinforcement Learning)是主体(agent)通过与周围环境的交互来进行学习。强化学习主体(RL agent)每采取一次动作(action)就会得到一个相应的数值奖励(numerical reward),这个奖励表示此次动作的好坏。通过与环境的交互,综合考虑过去的经验(exploitation)和未知的探索(exploration),强化学习主体通过试错的方式(trial and error)学会如何采取下一步的动作,而无需人类显性地告诉它该采取哪个动作。强化学习主体的目标是学习通过执行一系列的动作来最大化累积的奖励(accumulated reward)。 一般来说,真实世界中的强化学习问题包括巨大的状态空间(state spaces)和动作空间(action spaces),传统的强化学习方法会受限于维数灾难(curse of dimensionality)。借助于深度学习中的神经网络,强化学习主体可以直接从原始输入数据(如游戏图像)中提取和学习特征知识,然后根据提取出的特征信息再利用传统的强化学习算法(如TD Learning,SARSA,Q-Learnin)学习控制策略(如游戏策略),而无需人工提取或启发式学习特征。这种结合了深度学习的强化学习方法称为深度强化学习。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

阿尔法围棋技术

阿尔法围棋是于2014年开始由英国伦敦Google DeepMind公司开发的人工智能围棋程序。AlphaGo是第一个打败人类职业棋手的计算机程序,也是第一个打败围棋世界冠军的计算机程序,可以说是历史上最强的棋手。 技术上来说,AlphaGo的算法结合了机器学习(machine learning)和树搜索(tree search)技术,并使用了大量的人类、电脑的对弈来进行训练。AlphaGo使用蒙特卡洛树搜索(MCTS:Monte-Carlo Tree Search),以价值网络(value network)和策略网络(policy network)为指导,其中价值网络用于预测游戏的胜利者,策略网络用于选择下一步行动。价值网络和策略网络都是使用深度神经网络技术实现的,神经网络的输入是经过预处理的围棋面板的描述(description of Go board)。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

神经网络技术

(人工)神经网络是一种起源于 20 世纪 50 年代的监督式机器学习模型,那时候研究者构想了「感知器(perceptron)」的想法。这一领域的研究者通常被称为「联结主义者(Connectionist)」,因为这种模型模拟了人脑的功能。神经网络模型通常是通过反向传播算法应用梯度下降训练的。目前神经网络有两大主要类型,它们都是前馈神经网络:卷积神经网络(CNN)和循环神经网络(RNN),其中 RNN 又包含长短期记忆(LSTM)、门控循环单元(GRU)等等。深度学习是一种主要应用于神经网络帮助其取得更好结果的技术。尽管神经网络主要用于监督学习,但也有一些为无监督学习设计的变体,比如自动编码器和生成对抗网络(GAN)。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

逻辑技术

人工智能领域用逻辑来理解智能推理问题;它可以提供用于分析编程语言的技术,也可用作分析、表征知识或编程的工具。目前人们常用的逻辑分支有命题逻辑(Propositional Logic )以及一阶逻辑(FOL)等谓词逻辑。

语音识别技术

自动语音识别是一种将口头语音转换为实时可读文本的技术。自动语音识别也称为语音识别(Speech Recognition)或计算机语音识别(Computer Speech Recognition)。自动语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,目前的语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。自动语音识别在人工智能领域占据着极其重要的位置。

强化学习技术

强化学习是一种试错方法,其目标是让软件智能体在特定环境中能够采取回报最大化的行为。强化学习在马尔可夫决策过程环境中主要使用的技术是动态规划(Dynamic Programming)。流行的强化学习方法包括自适应动态规划(ADP)、时间差分(TD)学习、状态-动作-回报-状态-动作(SARSA)算法、Q 学习、深度强化学习(DQN);其应用包括下棋类游戏、机器人控制和工作调度等。

推荐文章
暂无评论
暂无评论~