数据库,作为三大基础软件技术之一,是企业IT系统必不可少的核心技术。因此在上个世纪90年代后期开始,商业数据库就在信息化时代构建起了一个“帝国”。
之所以称之为“帝国”,是因为传统商业数据库是封闭技术,只掌握在少数巨头手中,这是数据库40多年发展历程中的第一个阶段。
其后则是开源数据库的崛起,凭借互联网的应用场景为试验田,以远超商业数据库的高性价比,迅速树立了市场地位。而伴随着云时代的呼啸而来,云原生数据库凭借高可靠、高可用、高性能,高弹性、自动化智能部署与运维等优势,逐渐被企业用户广为认可。
中国工程院院士孙家广指出,“传统数据库厂商逐渐失去了原有的霸主地位,而生于云、长于云、基于云原生架构的数据库开始成为市场的中坚力量。”这是否意味着属于云原生数据库的时代已然到来?
01
为什么说云原生数据库已成主流
如今,所有的企业都在加速上云,尤其是很多大行业,都已经开始从过去的创新业务上云,逐渐演进到核心系统上云。
这次演进过程中,传统数据库的很多弊端将会一览无遗。因为传统数据库通常是紧耦合的设计方式,在高可用和伸缩性上明显跟不上业务云化的快节奏。试想,数据库系统的扩容如果要进行几个月的时间,业务的洪峰可等不了那么久,更别说洪峰之后的缩容也会造成资源的浪费。
而云本身就代表着一种灵活性和弹性,云数据库明显要比传统数据库更适应云时代的业务发展要求。同时,基于虚拟化技术的云,资源是松耦合的,资源池化之后,可以按需按量使用、弹性调度,云原生数据库可以根据业务需要对计算、存储进行快速的扩缩容,让企业更有效地使用资源,而越是规模化的应用,为企业带来的价值就越大。
正是基于这样的价值,很多大型企业纷纷转投云原生数据库,并用其支撑起庞大的业务规模,如中国联通,使用阿里云瑶池数据库替换原有IT系统架构,支撑了超4.2亿用户、计费数量高达450亿/天、20万容器数量,打造了全球规模最大的电信业务系统之一。
根据Gartner的预测,到2023年,75%的数据库都要跑在云平台之上。可以预见,云原生数据库成为市场主流的进度,还会进一步加快。
“云数据库是一个全新的赛道,在这条赛道上云厂商具备先发优势。”阿里云数据库产品事业部负责人李飞飞表示,以PolarDB为代表的瑶池数据库打造“云原生+一站式”的数据管理与服务,正在带领国产数据库实现换道超车。
02
不拥抱“四化”的数据库,一定没有未来
但知易行难,要冲破传统数据库“固守”40年的防线,目标固然远大,既要顺应时代发展的趋势,更需要强大的方法论支撑。
这个方法论,李飞飞称之为“四化”。即阿里云在云数据库赛道上提出的四化,云原生化、平台化、一体化、智能化四个方向。
首先,云原生化早已成为共识,当下所有与数据、资源、云相关的技术都建立在云原生化的基础上,这是大势所向。
其次,平台化的背后,是单一的数据库产品包打天下解决所有问题的时代已经结束,这意味着需要以平台化的思维去构建包括多个引擎、基于一个平台来提供一站式的能力和解决方案。而平台化的趋势,则倒逼云数据库进行软硬协同创新,以帮助客户解决实际场景中的问题。
第三,一体化的本质是“简单化”。数据库一个萝卜一个坑,不一定是一件合理的事情,如果每一项具体类型的数据都需要对应一个数据库,复杂的基于数据层面的运维会随着数据量的增大,让用户感到崩溃。所以,多模数据统一在一个存储引擎将是未来的趋势。
数据库技术应该回归本源,变成“简单”的技术,一体化就是为了化繁为简而生,同时一体化也会带来更高的性价比。例如阿里云将云原生数据库PolarDB和云原生数据仓库AnalyticDB打通融合,形成“云原生一体化”的HTAP解决方案。该方案为用户提供统一入口,兼具数据处理与分析能力,为用户带来一站式的数据库使用体验。基于某游戏客户的真实测算,相比其他方案,云原生一体化HTAP方案以50%的成本提供了2倍性能。
第四,智能化。这两个月chatGPT的风暴席卷,让每个人都意识到AI的未来已来,任何行业都必须要跟上智能化的脚步,数据库也不例外。AI For DB就是用智能化的技术来做数据库的运维;DB For AI,则代表着一种数据库的智能化创新模式。
例如阿里云推出的全新多模数据库Lindorm AI 引擎,在数据库内集成AI 能力,对非结构化数据进行智能分析和处理,打造AIGC应用的数据基础设施。仅需写几段SQL语言,就能在数据库内完成模型的部署和推理,快速搭建起一个AI应用的平台。
李飞飞说,如果想在数据库这个竞争激烈的赛道上走到下一个春天,接下来必须全面拥抱“四化”,不拥抱“四化”的厂商将没有任何机会。
03
一站式解决方案与产品技术路线创新
工欲善其事必先利其器,要打造一站式的数据管理与服务,阿里云瑶池所面向的三大赛道,就需要不断加快创新的速度。
核心产品,云原生数据库PolarDB,覆盖传统关系型和分布式数据库的全场景;云原生数据仓库AnalyticDB以数据湖的规模,数据库的体验,提供数据计算分析一体化的服务;多模数据库 Lindorm面向物联网数据、AIGC等多模数据处理。三大产品你中有我,我中有你,相互协同为各种企业提供数据管理和服务。
在产品策略升级上,除了PolarDB和AnalyticDB的一体化之外,还有几个重要的信息点:
第一,ALL in serverless。在信通院Serverless认证中,PolarDB和RDS均获评最高的“先进级”,而AnalyticDB也获评“增强级”。同时,在过去一个月内,阿里云连续发布了RDS SQL Server 版的Serverless 公测版本,和RDS PostgreSQL Serverless版。至此,从去年4月份以来,阿里云瑶池数据库的三款产品均有 Serverless 版本。ALL in serverless已近在眼前。
第二,阿里云连续三年蝉联关系型数据库全国市场份额第一,旗下的PolarDB数据库不仅100%兼容MySQL和PostgreSQL,还高度兼容Oracle。按照李飞飞公布的数据,PolarDB交易和分析性能分别是开源数据库6倍和100倍,TCO则低于自建数据库50%。
第三,PolarDB的列存索引(In Memory Column Index,IMCI)原本是以交易为主的产品,但融入了分析的能力,实现了事务处理与计算分析一体化。这就使复杂的SQL查询提升了100倍,而数据可见性延迟下降了100倍,效果喜人。
第四,PolarDB实现了集中式与分布式一体化。传统数据库视角,集中式和分布式这两者是泾渭分明的,但在云原生的视角下,因为资源是池化、解耦合的,所以集中式和分布式就不再分明,从集中式到分布式可以平滑过渡,虽然引擎中还是有集中式和分布式的区别,但这种平滑的过渡可以让业务无感知,客观的说,这也是一种客户视角的创新。
事实上,瑶池数据库品牌成立之后,也起到了对阿里云数据库解决方案组合的拉动作用,尤其在政府、金融和企业这三个大的领域里,解决方案已成为阿里云联接客户的抓手。通过瑶池数据库品牌,把OLTP、OLAP、NoSQL三个系列产品组合在一起,能够为客户提供一体化的解决方案。