星云Clustar 获红杉中国数千万元天使轮投资

日前,“星云Clustar”已获得数千万元天使轮融资,由红杉中国投资。

星云Clustar是一家提供人工智能云服务的高科技创业公司,致力于将超算的科研和技术成果应用到商用领域,为企业AI生态系统打造高效的分布式机器学习系统。其核心团队由科学家陈凯和杨强组建。

陈凯,星云Clustar创始人兼首席科学家。

陈凯在互联网技术、数据中心、大数据人工智能底层架构等方向深耕十余年,是相关领域杰出的华人青年科学家,现任香港科技大学网络系统实验室主任,港科大-微信人工智能技术联合实验室主任。其主要研究方向包括数据中心网络,云计算系统,大数据和分布式机器学习的底层架构,专注于网络系统的设计和实现。陈凯曾多次在ACM SIGCOMM, USENIX NSDI,IEEE/ACMTON等国际顶尖学术会议和期刊上发表多篇论文阐述其研究成果,其中SIGCOMM/NSDI论文近三年居亚洲第一。 

杨强,星云Clustar联合创始人。

杨强人工智能研究领域深耕三十年,是国际公认的人工智能全球顶级学者,ACM/IEEE Fellow,首位美国人工智能协会(AAAI)华人院士,迁移学习领域的奠基人和开拓者,在数据挖掘人工智能、终身机器学习和智能规划等研究领域都有着卓越贡献。

陈凯在科研上积累的技术成果主要集中在为商用数据中心提供高性能的网络架构,如以太网RDMA技术,网络计算,应用感知的流量调度和路由算法等。人工智能领域的数据体量和对分布式计算的需求为这些网络技术成果提供了绝佳的应用场景。近年来,陈凯与腾讯、微软、华为等科技公司一直保持深度合作,并于2016年为华为设计了全球网络通了信业界首个基于机器学习的网络大脑核心;此外,他还带领研究团队与微信深度合作开发Amber深度学习平台。Amber与TensorFlow相同,也是一种深度学习计算框架,在底层网络上他们将基于RDMA网络传输技术应用到数据传输环节,实现了平均提速3倍的计算效果。

RDMA技术 作为超算中心网络互联的高性能通信协议,以太网RDMA技术(RDMA over Converged Ethernet)在消除TCP/IP性能瓶颈的同时,通过兼容以太网的方式,大幅度降低部署和维护成本,从而可用于商用数据中心;

网络计算平台(in-network computing) 通过可编程交换机和智能网卡,在通信的同时承担一部分甚至全部计算任务,消除软件和CPU的性能瓶颈;

应用感知的流量调度和路由算法 可以监测不同人工智能应用的运行状态,将优化的流量调度和路由策略迅速部署在网络设备中,从而减少拥塞,改善网络状况,大幅度降低性能抖动和运维成本。

“无论是传统CPU的多核迭代,还是如今的FPGA、ASIC芯片,都是在单点/单服务器上提升算力。随着数据量增多,模型增大,大规模分布式处理成为必须途径,由此而带来的问题是,很多资源在服务器传输间被消耗。单点算力固然重要,但服务器之间的互联、参数在各个节点之间如何高效传输是更为值得研究的方向。”陈凯说道,星云Clustar正是致力于此——通过商用数据中心高性能的网络架构,赋能AI算法和单点计算能力,消除大规模机器学习应用的落地瓶颈,从而加速人工智能产业的发展。

在陈凯看来,目前人工智能行业处于不均衡的发展状态:

少数头部互联网/科技企业拥有先进技术和海量数据,对于大规模分布式计算集群有迫切需求;而大量传统企业处于信息化至数据化的过程中,人工智能的应用尚在试探性研究阶段。

因而,在行业整体解决方案输出上,星云Clustar对于头部科技型企业,以高性能基础架构为主要产品,与IT供应体系建立战略合作,构建有竞争力的供应与服务体系。而对传统企业,星云Clustar则为其提供基于自有技术的软硬件一体化AI解决方案,解决企业用户的实际业务问题,帮助企业落地AI私有云。

据悉,公司在2017年注册,2018年境内重组,现在是人民币架构。目前团队共20多人,分别是在北京研发中心和香港实验室。

产业创业公司杨强人工智能应用云服务融资
2
相关数据
杨强人物

杨强现任香港科技大学新明工程学讲席教授、计算机科学和工程学系主任,大数据研究所所长 。他是人工智能研究的国际专家和领军人物,在学术界和工业界做出了杰出的服务和贡献,尤其近些年为中国人工智能(AI)和数据挖掘(KDD)的发展起了重要引导和推动作用。

深度学习技术

深度学习(deep learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。 深度学习是机器学习中一种基于对数据进行表征学习的算法,至今已有数种深度学习框架,如卷积神经网络和深度置信网络和递归神经网络等已被应用在计算机视觉、语音识别、自然语言处理、音频识别与生物信息学等领域并获取了极好的效果。

机器学习技术

机器学习是人工智能的一个分支,是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。因为学习算法中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

感知技术

知觉或感知是外界刺激作用于感官时,脑对外界的整体的看法和理解,为我们对外界的感官信息进行组织和解释。在认知科学中,也可看作一组程序,包括获取信息、理解信息、筛选信息、组织信息。与感觉不同,知觉反映的是由对象的各样属性及关系构成的整体。

调度技术

调度在计算机中是分配工作所需资源的方法。资源可以指虚拟的计算资源,如线程、进程或数据流;也可以指硬件资源,如处理器、网络连接或扩展卡。 进行调度工作的程序叫做调度器。调度器通常的实现使得所有计算资源都处于忙碌状态,允许多位用户有效地同时共享系统资源,或达到指定的服务质量。 see planning for more details

人工智能技术

在学术研究领域,人工智能通常指能够感知周围环境并采取行动以实现最优的可能结果的智能体(intelligent agent)

参数技术

在数学和统计学裡,参数(英语:parameter)是使用通用变量来建立函数和变量之间关系(当这种关系很难用方程来阐述时)的一个数量。

规划技术

人工智能领域的「规划」通常是指智能体执行的任务/动作的自动规划和调度,其目的是进行资源的优化。常见的规划方法包括经典规划(Classical Planning)、分层任务网络(HTN)和 logistics 规划。

TensorFlow技术

TensorFlow是一个开源软件库,用于各种感知和语言理解任务的机器学习。目前被50个团队用于研究和生产许多Google商业产品,如语音识别、Gmail、Google 相册和搜索,其中许多产品曾使用过其前任软件DistBelief。

张量技术

张量是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 维空间内,有 个分量的一种量,其中每个分量都是坐标的函数,而在坐标变换时,这些分量也依照某些规则作线性变换。称为该张量的秩或阶(与矩阵的秩和阶均无关系)。 在数学里,张量是一种几何实体,或者说广义上的“数量”。张量概念包括标量、矢量和线性算子。张量可以用坐标系统来表达,记作标量的数组,但它是定义为“不依赖于参照系的选择的”。张量在物理和工程学中很重要。例如在扩散张量成像中,表达器官对于水的在各个方向的微分透性的张量可以用来产生大脑的扫描图。工程上最重要的例子可能就是应力张量和应变张量了,它们都是二阶张量,对于一般线性材料他们之间的关系由一个四阶弹性张量来决定。

数据挖掘技术

数据挖掘(英语:data mining)是一个跨学科的计算机科学分支 它是用人工智能、机器学习、统计学和数据库的交叉方法在相對較大型的数据集中发现模式的计算过程。 数据挖掘过程的总体目标是从一个数据集中提取信息,并将其转换成可理解的结构,以进一步使用。

云计算技术

云计算(英语:cloud computing),是一种基于互联网的计算方式,通过这种方式,共享的软硬件资源和信息可以按需求提供给计算机各种终端和其他设备。

大数据技术技术

大数据,又称为巨量资料,指的是传统数据处理应用软件不足以处理它们的大或复杂的数据集的术语。

迁移学习技术

迁移学习是一种机器学习方法,就是把为任务 A 开发的模型作为初始点,重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务,虽然大多数机器学习算法都是为了解决单个任务而设计的,但是促进迁移学习的算法的开发是机器学习社区持续关注的话题。 迁移学习对人类来说很常见,例如,我们可能会发现学习识别苹果可能有助于识别梨,或者学习弹奏电子琴可能有助于学习钢琴。

分布式计算技术技术

在计算机科学中,分布式计算,又译为分散式運算。这个研究领域,主要研究分布式系统如何进行计算。分布式系统是一组电脑,通过网络相互链接传递消息与通信后并协调它们的行为而形成的系统。组件之间彼此进行交互以实现一个共同的目标。

推荐文章
暂无评论
暂无评论~