日前,“星云Clustar”已获得数千万元天使轮融资,由红杉中国投资。
星云Clustar是一家提供人工智能云服务的高科技创业公司,致力于将超算的科研和技术成果应用到商用领域,为企业AI生态系统打造高效的分布式机器学习系统。其核心团队由科学家陈凯和杨强组建。
陈凯,星云Clustar创始人兼首席科学家。
陈凯在互联网技术、数据中心、大数据和人工智能底层架构等方向深耕十余年,是相关领域杰出的华人青年科学家,现任香港科技大学网络系统实验室主任,港科大-微信人工智能技术联合实验室主任。其主要研究方向包括数据中心网络,云计算系统,大数据和分布式机器学习的底层架构,专注于网络系统的设计和实现。陈凯曾多次在ACM SIGCOMM, USENIX NSDI,IEEE/ACMTON等国际顶尖学术会议和期刊上发表多篇论文阐述其研究成果,其中SIGCOMM/NSDI论文近三年居亚洲第一。
杨强,星云Clustar联合创始人。
杨强在人工智能研究领域深耕三十年,是国际公认的人工智能全球顶级学者,ACM/IEEE Fellow,首位美国人工智能协会(AAAI)华人院士,迁移学习领域的奠基人和开拓者,在数据挖掘、人工智能、终身机器学习和智能规划等研究领域都有着卓越贡献。
陈凯在科研上积累的技术成果主要集中在为商用数据中心提供高性能的网络架构,如以太网RDMA技术,网络计算,应用感知的流量调度和路由算法等。人工智能领域的数据体量和对分布式计算的需求为这些网络技术成果提供了绝佳的应用场景。近年来,陈凯与腾讯、微软、华为等科技公司一直保持深度合作,并于2016年为华为设计了全球网络通了信业界首个基于机器学习的网络大脑核心;此外,他还带领研究团队与微信深度合作开发Amber深度学习平台。Amber与TensorFlow相同,也是一种深度学习计算框架,在底层网络上他们将基于RDMA网络传输技术应用到数据传输环节,实现了平均提速3倍的计算效果。
RDMA技术 作为超算中心网络互联的高性能通信协议,以太网RDMA技术(RDMA over Converged Ethernet)在消除TCP/IP性能瓶颈的同时,通过兼容以太网的方式,大幅度降低部署和维护成本,从而可用于商用数据中心;
网络计算平台(in-network computing) 通过可编程交换机和智能网卡,在通信的同时承担一部分甚至全部计算任务,消除软件和CPU的性能瓶颈;
应用感知的流量调度和路由算法 可以监测不同人工智能应用的运行状态,将优化的流量调度和路由策略迅速部署在网络设备中,从而减少拥塞,改善网络状况,大幅度降低性能抖动和运维成本。
“无论是传统CPU的多核迭代,还是如今的FPGA、ASIC芯片,都是在单点/单服务器上提升算力。随着数据量增多,模型增大,大规模分布式处理成为必须途径,由此而带来的问题是,很多资源在服务器传输间被消耗。单点算力固然重要,但服务器之间的互联、参数在各个节点之间如何高效传输是更为值得研究的方向。”陈凯说道,星云Clustar正是致力于此——通过商用数据中心高性能的网络架构,赋能AI算法和单点计算能力,消除大规模机器学习应用的落地瓶颈,从而加速人工智能产业的发展。
在陈凯看来,目前人工智能行业处于不均衡的发展状态:
少数头部互联网/科技企业拥有先进技术和海量数据,对于大规模分布式计算集群有迫切需求;而大量传统企业处于信息化至数据化的过程中,人工智能的应用尚在试探性研究阶段。
因而,在行业整体解决方案输出上,星云Clustar对于头部科技型企业,以高性能基础架构为主要产品,与IT供应体系建立战略合作,构建有竞争力的供应与服务体系。而对传统企业,星云Clustar则为其提供基于自有技术的软硬件一体化AI解决方案,解决企业用户的实际业务问题,帮助企业落地AI私有云。
据悉,公司在2017年注册,2018年境内重组,现在是人民币架构。目前团队共20多人,分别是在北京研发中心和香港实验室。