存储系统、计算平台、网络通信等基础架构软件(Infrastructure Software)是互联网和大数据时代的发动机,是软件皇冠上的明珠。从上个世纪80年代开始,该领域就已经是群雄逐鹿的市场,很多公司如Oracle 依靠在架构软件上的创新成长为巨型独角兽。进入云计算的新世纪,软件工程师们耳熟能详的那些开源架构软件,Elastic、Spark、MangoDB、Kafka,背后都有着非常成功的创业公司和商业价值。
基础架构软件为什么牛?
成功的基础架构软件具有超大行业影响力和商业价值。
获得广泛使用的基础架构软件成为一种实质上的行业标准:大家学习它、使用它,在其基础上构造了成千上万的应用。这就使得架构软件具备相当大的不可替代性。都说 VC 最喜欢的是“垄断”生意,基础架构软件非常符合赢家通吃的特点。Elastic 和 Spark 等产品就已经成为当前软件时代难以撼动的标准。PingCap 黄东旭也毫不掩饰自己的目标是成为分布式数据库的世界标准。
越靠近底层的产品,越具备成为超级独角兽的潜力。基础架构具有很强的横向扩展性,被每个 IT 团队所需要。同时基础架构软件离每个公司的具体业务都有一定的距离。与业务脱钩意味着无需定制,用标准产品来获得收入可以具有更高的扩展性和更高的毛利率。
基础架构软件为什么难?
对基础软件的设计需要有超强的技术前瞻力。站在现在看未来,下一代的技术架构应该是什么样子?能够做出正确判断的创业者往往在其领域实践多年,有深入认知,并形成对技术发展的独立判断。例如 Alluxio 李浩源认为存储系统是长期分化、不断更替的,在计算和存储之间有可能抽象出一个易使用、标准化的数据编排层(Data Orchestration),来屏蔽异构的存储和复杂的部署。OneFlow 袁进辉立志做最高性能的人工智能框架,他认为静态图编译+去中心化调度+高并发的流式执行最接近高性能计算的现代体系架构,是他心目中最美的 AI 计算模型。在获得广泛认可之前,这样的信念对于技术流创始人来说是非常“自然”的事情,技术的发展就应该是这样的,这也成为支撑创业团队奋斗的信仰。
基础软件有很高技术门槛和很长研发周期。Elastic 的第一版发布于2010年,直到2018年才开始成规模的商业化。基础软件的研发初期往往需要一个小规模核心团队潜心开发,在这个阶段人员规模和资本推动都无法为其加速。完成第一阶段的核心开发后,从核心架构到终端产品需要大规模研发投入,此时成规模的商业化仍有一段距离,需要大量风险资本支持。下表是美国最知名的若干基础软件项目在产品首次发布到实现过亿美元收入所经历的时间以及融资额。
为什么很多基础软件选择开源?
如果说基础软件的成功来源于其影响力,那开源就是小公司(创业公司)扩大影响力的超车道。
PingCAP是中国开发者主导的最成功的开源软件之一,其联合创始人黄东旭给我们介绍了很多软件开源的直接好处。开源软件可以获得大量免费用户。代码开源后是骡子是马就很清楚了,优质的开源项目很容易得到程序员的认可和使用。愿意尝鲜的程序员和互联网公司又常常是软件行业的话语领袖。PingCAP 的发展早期得到了知乎和 Mobike 的背书,对其帮助非常大。开源社区还是一个最好的产品经理,大家的反馈可以帮助创业公司确定最佳的研发优先级。
开源软件也是一个赛马场,最好的团队会胜出。Spark 和 Elastic 在早期也有很多开源软件与其同时起跑,但在长跑中陆续掉队。在 AI 框架方面,TensorFlow、PyTorch、PaddlePaddle 等正在角逐行业标准。在短短两三年的时间 PyTorch 就再很多方面超过 TensorFlow,得到学术圈很多用户的认可。在行业标准尘埃落定之前,OneFlow 这样的后来者仍然有与巨头过招的机会。
开源软件怎么商业化?
基础软件开源往往是其软件架构的核心部分。最重要的部分已经开源,基础软件要怎么收费呢?
从开源软件核心到能够实际解决问题的终端产品仍然有非常大的工程鸿沟。开源软件在商业化开始前往往大规模扩大研发团队,针对各个使用场景开发大量的外围功能。例如 Elastic 的开源产品是其搜索和日志处理,而其商业版产品则针对安全、运维场景做了很多扩展。此外,开源软件都具有较高的复杂度和运维难度,技术能力不够的公司往往无法配置得当,或者需要额外的运维团队。
基础软件公司会把产品使用者分为“用户”和“客户”。用户是开源软件的免费使用者,他们往往是互联网公司和软件公司,自身有充足的技术能力,也对软件成本最为敏感。而非 IT 行业的更多公司会成为付费客户,选择开箱即用的基础软件商业版,并通过付费来获得更多的技术支持和服务。
美国的基础软件已经获得大规模的商业成功。熬过早期的产品研发期,Elastic、SnowFlake、DataBrick 等公司在迈过1亿美元的商业化门槛后仍然有超过50%甚至200%的年收入增长率。在中国基础软件的商业化尚未形成规模。在商业化的道路上,他们会遇到哪些挑战和机遇?
在中国当前有规模化 IT 预算的客户主要是超大企业,集中在金融、电信、政府等行业。这些甲方非常强势且对定制化服务有很高的要求。软件产品的定价权更多是掌握在甲方手中。付费模式以项目制为主,很难形成按年付费的订阅模式。客户往往要求私有化部署,造成产品部署和维护的成本增加。这种情况随着国内软件产品的技术水准提升和大企业的市场竞争程度提高正在改善,但比较缓慢。决策机制的变化速度与企业组织升级和决策者更替相关,应至少以五年为单位。中国软件行业的人才密度跟国外还有相当大差距,核心软件的研发需要多年积累,人才培养和技术门槛提升也是以五年为单位。
除了现有的大企业甲方,基础软件公司都在翘首企盼着中小企业的 IT 化。中小企业更有可能使用基础软件的云部署版本,这意味着更低的部署维护成本、更好的付费方式(按年付费,收入可预测)。基础软件公司可以掌握定价权,获得更高的收入和毛利。在美国,基础软件公司的收入中云部署版本的占比正在提升。以 Elastic 为例,其云部署版本在2020财年已经达到收入的22%,比一年前大大提升。Atypical Ventures 预计中国中小企业的 IT 化并不会比美国滞后太多。在餐饮、零售和工业领域,中国中小企业的竞争异常白热化,经过好几波 O2O 企业的教育,他们在数字化程度上领先全球。餐饮、零售和工业正在进行行业整合,一大批中等规模企业即将诞生,IT 化能帮助这些腰部品牌提升管理水平和行业竞争力。基础软件公司需要与垂直行业的 SaaS 公司成为技术合作伙伴,共同服务中小企业。
中国的基础软件需要处理好与巨头的微妙关系。特别靠近底层的计算和存储软件,巨头常常自研并与创业公司直接竞争,例如Amazon 有针对 Spark 的同类型产品,阿里 OceanBase 产品也在直接服务金融行业的客户。在垂直行业中,阿里、美团等巨头的本地生活和新零售业务团队在积极地为小企业直接提供 IT 服务,以提升自身平台的体验和价值。但由于基础软件的投入巨大,研发周期长,巨头正慢慢意识到自己并不能自研所有基础软件,因此阿里云、腾讯云等公有云厂商都在积极地将基础软件产品纳入其服务体系,并乐于与基础软件公司利润分成。对于创业公司来说,产品技术的局部领先力才是与巨头竞争和合作的硬实力。
基础架构软件有着超高技术门槛和超长研发周期,在商业化方面会有很大的挑战:大企业付费习惯待提升,中小企业 IT 化在路上。这是一个需要耐心投入做基础,大胆前瞻做预判的创业方向。