11 月 25 日,达梦召开 2020 创新产品发布会。会上,达梦发布了达梦数据共享集群、达梦启云数据库、达梦新一代分布式数据库、梦图数据库四款新产品,与合作伙伴回溯了艰辛的发展历程,分享了合作中的酸甜苦辣。当下,国内很多公司引进国外源码包装成国产,或基于开源数据库进行二次开发,其中甚至不乏市值破千亿的明星公司。相比于引进开源或国外源码这种短平快的发展模式,达梦则始终坚持自主原创,四十年磨一剑。在数据库领域,撑起了数据库自主创新旗帜。

 

 

 

达梦四十年磨一剑终成国产化数据库领导者

上世纪 70 年代末,武钢热轧车间花费巨资从日本引进了一套无人值守管理系统。为了防止技术泄密,日本人在调试安装完设备后,把足足三卡车的技术资料当场销毁。在现场目睹了这一幕的冯裕才痛下决心,一定要研发出中国人自己的数据库系统。

 

当时,甲骨文、微软、IBM 等数据库产品尚未进入我国,在没有国外产品可以参考的情况下,冯裕才潜心研究,用了 8 年时间终于开发出第一套数据库管理系统 CRDS,在之后的几年里多次在科技部国产数据库招标中名列第一,并承接了一批图形数据库、标准数据库、地图数据库项目。2000 年,达梦公司正式成立,开始迈出商业化的第一步。

 

商业市场既波澜壮阔,也充满暗礁漩涡。由于习惯于在象牙塔中搞研发,对于资本运作不甚了解,加上同时期甲骨文、微软、IBM 等外商的产品在国内横行无阻,达梦的商业化之路非常曲折,公司差点倒闭,冯裕才一度想转型系统集成商,不卖数据库产品,而是搭成一套应用系统卖。最艰难的时候冯裕才自己掏钱给员工发工资。很多时候,达梦往往成为竞标中的陪跑者,成为招标单位用来和外商杀价的工具。

 

当达梦逐渐适应市场后,国内一些公司引进国外开源技术,或是买 IBM 公司的源代码,在一些技术指标上把达梦挤下去。其实,自达梦公司成立以来,有从美国留学回来的学生想把美国公司的源代码直接卖给达梦,也有美国公司想收购冯裕才的技术团队,还有人呼吁达梦放弃自主研发,也采用免费的开源技术。面对拿来主义、外资收购、开源技术等诱惑,达梦咬定青山不放松,始终坚持自主研发,自己掌握核心技术。

 

目前,上海浦东新区数据中心、武汉市政府投资项目监管平台、广州市信息化服务中心数据中心、重庆市政法系统信息共享平台、、中铁建财务共享平台、吉林财政国库集中支付、建设银行业务收发文应用平台、人民银行湖北分行金融基础信息查询系统、武汉住房公积金核心业务系统、国家智能电网调度指挥系统 D5000、南方电网 OS2 地级主站系统、泰国教育云平台等项目均采用达梦数据库,历经 40 年的磨炼,达梦成为最纯粹的国产化数据库的领导者。

 

 

十二年如一日填补技术空白

数据共享集群是在多台服务器上构建高可用性数据库系统的最佳解决方案,也是数据库领域技术的制高点,是商业数据库技术的皇冠,这项关键的核心技术在我们的金融、电力、运营商等核心重点的行业市场占有率超过了 60%。在最近几年“开源运动”和分布式数据库、NoSQL 数据库如火如荼的大背景下,共享集群在重点行业的地位依然无可替代,因为无论技术的风口怎么在变,共享集群的价值无可替代,并仍然被用户广泛的认可。

 

达梦数据共享集群的关键技术也不是一蹴而就的。2008 年,国家电网提出数据共享存储集群的相关需求。2012 年,达梦实现两个节点,两台服务器共享集群的关键技术。不过,这对于达梦而言,只是完成了 0 到 1 的突破。拿到了入场门票后,还有更多的工作要做,因为用户需要的是一款成熟的产品,后面还有 99%的工作需要我们继续去努力。

 

在过去几年里,达梦数据库在共享集群的几个方面做了持续改进:

 

一是规模。诚然,国外的共享集群在实际应用当中绝大多数都是两个节点打以天下,四个节点用的都不是特别多,但一款商品要想在市场上被广泛接受,就必须有应对所有场景的能力。目前,达梦数据共享集群做到了从两个节点到八个节点规模的支持,并且通过了第三方机构的测试,后续还会继续向 16 个节点的规模去做演进。

 

二是服务中断的时间问题。对于关键核心的业务用户非常关注,如果以 5 个 9 的指标来考量,每年发生一次故障,数据库可以用于故障处理的时间是 5 分钟,如果故障发生频率提高每个月一次,留给数据库的时间就是 25 秒。也就是换句话说,以 5 个 9 为目标,共享存储集群如果能够做到每次故障切换时间控制在 25 秒以内,就能够承受每月发生一次系统故障。为了达到这个目标,达梦通过理论分析,确定了共享存储集群架构在故障切换时间方面的理论性优势,通过持续优化,将故障切换时间从以前的冷备方案的小时级,改进优化到共享集群的 10 秒到 30 秒的速度,基本上完成了 5 个 9 的技术要求

 

三是数据容灾。达梦可以向用户提供从 50 公里级到 1000 公里级,以及两地三中心的容灾解决组合方案。在本地或者是在同城基于达梦数据守护技术和达梦数据共享集群进行组合,可以实现 RPO 为 0 的超级容灾。在 1000 公里级的容灾,基于达梦的实时同步技术,可以实现延时为秒级的数据容灾。上面两项技术的组合,还可以构建两地三中心的容灾解决方案。

 

四是性能。达梦单机四节点的共享集群 TPC—C 值超过了 200 万,八节点超过了 300 万,具有不错的横向扩展能力。可以说,在 TPC—C90%操作都是写操作的业务产品,对于集中式架构而言是一个突破。

 

五是存储管理。达梦进一步改进了存储管理系统,引入了在裸设备之外引入了快设备方式的存储管理,并且提供了存储条带化功能。这两项特性的引入能够更好的提供运维便利性和性能表现。

 

六是平台支持。实现了对各种主流 CPU 的全面支持。由于过去只有少数美国公司掌握这项关键技术,数据共享集群此前从来没有在国产 CPU 上面跑起来,达梦实现了网信名录内所有国产 CPU 均支持。南京某首个基于国产 CPU+共享存储集群的上线业务系统就是采用了达梦的数据库。在浙江电网共享存储集群支撑了电网的核心业务系统,事关到 5000 万人的正常生产和生活的工作,这个系统也是基于达梦数据库。

 

这里有一个测试的数据,在一个写入操作达到了 50%比例的仿真测试场景当中,在四节点规模的集群下面实现了 90%操作的响应时间,不超过 1 秒,并且吞吐量达到了每秒 3000 笔业务的成绩。

 

过去,在全世界只有甲骨文、IBM 等个别美国公司掌握这项技术,而且没有开源的技术可以参考,这从侧面可以印证这项技术的基础难度。达梦经过 12 年的积累,终于掌握了这项关键技术,实现与国外的数据库产品同台竞技。相对于那些只会引进国外源码或拿开源代码做修改的公司而言,达梦 12 年如一日填补国内空白,是尤为可贵的。

 

东风已至 达梦有望扶摇直上

目前,中国数据库行业发展即将迎来前所未有的契机,一方面数字基础设施它的加速建设、人工智能、云计算等新兴技术的快速发展,对数据库产品提出了新的要求,进而也具备了打破传统数据库厂商竞争格局的机会。另一方面,国家对网络安全的愈发重视以及网信市场的不断推进,也为数据库厂商提供了新的市场机遇。

 

随着云计算、大数据、人工智能等技术的发展,IT 企业由粗放式向集约化逐步发展,基础设施集约化,平台软件集约化,应用软件集约化,成为 IT 发展的主流方向。就数据库而言,基于云构建、部署、分发和监管的数据库服务,将成为数据库发展的主流方向。全球最大的信息技术研究和分析机构 Gartner 2019 年发了一份报告,报告显示数据库的未来是云化,到 2021 年将会有 50%以上的数据库是以云服务的方式去提供,到 2023 年将会有 75%以上的数据库是以云服务的方式去提供。

 

 

针对数据库云化的发展趋势,达梦研发了启云数据库,以云服务的方式满足用户需求。达梦启云平台是一个完全中立的平台,启云数据库既可以独立部署、独立运行,独立的为用户提供数据库服务,也可以跟广大的云厂商进行合作,把启云接口化、服务化,跟第三方云厂商进行深度的对接。2020 年 8 月,达梦在招投标中胜出,成为第一家在移动云的互联网上提供国产关系数据库服务的数据库企业,达梦把所有的功能和能力以接口服务的方式提供给移动云,移动云完成适配、对接以及界面开发。在广西电子政务外网的项目中,达梦与浪潮云、华三云完成适配和对接,部署了 30 个云上数据库服务授权,为后续自治区全业务上云提供支撑。

 

得益于互联网和云计算的发展,分布式数据库开始受到热捧。达梦开发了非常适合金融、电力场景应用的分布式数据库。该分布式数据库有几个特点,一是可随需扩容,在高峰时支持高并发,在高峰时间过了之后可以回收,实现可聚可散。二是具备跨地域冗余的保障,保障数据和服务都不停机。三是组件低耦合、轻量化,以便于云端快速的部署迁移。

 

就政治大环境来看,过去几年,美国特朗普政府屡屡制造摩擦,特别是利用美国在高科技领域的优势打击中国企业。这一方面使国内不少企业的日子比较难过,另一方面则给国内这些几十年如一日坚持自主研发的 IT 公司创造出发展机遇期。

 

当下,科技自立自强、国内大循环已经成为重大发展战略。CPU、操作系统和数据库是计算技术、计算软硬体系当中最核心、最基础、最重要的三个技术。数据库作为基础软件方面的重要组成部分,应该说在信息当中处于底座、处于核心的地位,是各项业务系统运行的关键。

 

党的重大政策非常明确,机关单位和央企对于对国产数据库的需求非常的旺盛,用户也都非常支持,企业自己也都非常的努力,资金也不愁,融资也非常的方便,大家都看好国产化替代工程。

 

长远来看,建立国产 CPU+OS+数据库的自主生态体系是大势所趋,在 CPU 方面,龙芯、飞腾、申威是国产 CPU 的代表。在 OS 方面,麒麟和统信是其中的佼佼者。在数据库方面,有鉴于达梦已经占据部委和地方网信市场的 55%,俨然成为国产数据库的领头羊。

 

 

诚然,相对于甲骨文、微软、IBM 的数据库,达梦数据库依然存在这样或那样的不足,但这并非无法弥补。90 年代,国外产品问题比达梦现在多得多,为什么当年国内用户能容忍甲骨文、微软、IBM 的产品能出问题?现在国产的技术水平上来了,而且是全线上,这个是了不起的一件大工程,从全国的试点和应用情况来看,差距并非不可弥补,只要大家把服务到位,产品做的更加精益求精,眼前的这些问题都可以解决。

 

期待达梦能够乘着云数据库和网信事业的东风扶摇直上。