几十个问题,万字长文,阿里云新任总裁行癫履新后首次深入讨论阿里云对云计算未来的判断,深度解读未来阿里云生态战略,揭秘阿里技术委员会和阿里中台思想的原生思考。
以下是行癫接受媒体采访的原文。
关于云计算的未来
Q:你关注到云计算竞争的焦点在发生什么样的变化,好像大家还比较关心价格?
行癫:价格是初级竞争,最终还是回归到核心价值。价值要从两端来体现,一个是技术端,一个是应用端。云一开始都是做基础设施,但阿里巴巴从做云第一天起,做的就不仅是现在这个云,当初的理念是做一个数据处理平台,这和当时数据处理能力与业务的脱节也有关系,因为是十年前,很少有公司是基于智能、基于数据的,大部分是基于流程。
后来做了一段时间,发现光做这个还不够,在中国要想成功,还得有基础设施。
当然我们做的过程也比较曲折,一开始还想在开源系统上做数据处理,后来发现也不对,必须自研,阿里巴巴不仅是做了一个云的基础设施体系,也做了一个数据处理体系(备注:现在叫MaxCompute,当时叫做ODPS),这个是绝无仅有的,包括国内国外。
当然这个过程有点远,所以回过头来又必须把IaaS层做好。底层的竞争肯定是拼基础设施的成熟度、稳定性和价格,但是上层的竞争肯定是拼人工智能等等。
Q:你刚才谈到数据处理,开源为什么不行?
行癫:其实所有的开源软件公司都没有面对过这么大的数据量,Hadoop 、Spark是比数据库的处理能力前进了一大步,用分布式、用MapReduce的方法,但他们的数据量跟阿里巴巴数据量比还是差非常远。
第二个是开源的稳定性要求也达不到我们的要求。所以那时候我们第一次做了一个5K的集群,开源当时不可能超过5000台机器的,我们第一次突破了机器的限制,可以用更大规模的集群来处理。第三我们考虑成本,因为数据量规模小不关心成本,大了以后我们更加考虑成本,现在我们阿里巴巴每年业务量都是增长50%以上,但是我们的成本不能线性增长。
我们去年开始大规模混部(备注:一种新技术,使得在线处理与离线处理不再分别拥有专有的机器,而是运行在同一个集群的机器上,可以极大地节省资源,对于调度部署能力要求极高),我们没有专用的离线机器去处理大数据,都是用在线跑的机器做大规模的混部。双11来了,前一个小时暂时不处理数据分析全部用来跑应用,高峰过去之后,调度所有机器去做数据分析,开源是不可能做这个事情的。
我觉得大数据领域如果自己公司没有应用,很难设计出一个很有弹性,很高性价比的、很高稳定性的处理平台。