主页 > 大数据 > 中国最大的数据库?

中国最大的数据库?

一、中国最大的数据库?

华为的数据库叫高斯数据库(Gauss DB),按照媒体的说法,目前出货量已超3万套,在国产数据库中,名列前茅。

高斯数据库2007年的时候就开始研发,先后有三代,分别是GaussDB100、GaussDB200、GaussDB30,目前已经到了招商、工商银行的验证和认可,同时还在很多运营商中使用,已经得到了认可。

二、中国跨过数据库这座大山了吗?

利益相关,腾讯云数据库员工。

背景:非技术人员不太会写代码。文章没检查,个把小时搞的,估计有不少错别字,各位见谅。

不怎么懂技术只会写点简单程序,讲的很多都市场人测的看法,吹捧大家都会,钱不会骗人。喷的随意,烦请喷出点道理,纯喷就很无聊了。这篇对某些厂商的看法也不正面,招黑正常嘿。

先上结论。

· 过了两年更新一下,相比两年前现在非常有信心跨过去,我们和竞品同行拿到了大量的case,长风破浪会有时,直挂云帆济沧海。

①传统关系型数据库没跨过去,想跨过去的希望只存在于阿里腾讯这种大厂,现在已经走在半山腰了;

②云数据库刚兴起每几年,谁都不比谁差多少;

③新形态数据库有可能出现突破性产品和突破性技术,国内比起老美还是差,但是不存在oracle那种巨山要跨。

我是一个非技术人员,从几个角度说下这个:

1、 数据库为什么是个大山:数据库是什么在干什么,数据库为什么难做;

2、 数据库中的大山——Oracle为啥牛逼;

3、 国产数据库是啥状态;

4、 国产能不能行。

· 如果你懂数据库,前两部分直接可以略过了。

=============

最近有个大case,国内首个case,以前国内商业银行的核心系统从来不敢用国产数据库,但是现在,张家港银行核心系统用了腾讯的Tdsql。

国内首个!

=============

一、数据库是啥,为啥那么难做。

我们先看看数据库这个大山是什么山。

数据库大神,图灵奖获得者迈克尔·斯通布鲁克(碎石者~( ̄▽ ̄~)~)(Michael Stonebraker)在他的一篇论文里(What Goes Around Comes Around)简介了几十年的数据库历史,并且半吐槽性质的表达了一种观点:都几十年了,不管出多少数据库,干的还是那些事。

迈克尔说的这些数据库需要做的事,其实任何一个用过数据库的人都应该清楚:1、把数据存起来;2、把数据取出来。

几十年,就这点事,为啥还难?因为这里面学问太大了,网上很多内容都会讲技术原理,我用举例的方法给大家讲下为啥难。

· 每秒存1条数据简单,但是一下存100万条就难了;

· 存100万条,还要保证先后顺序,还要保证系统不卡死;

· 存100万条,还要修改,还经常会出现几乎同一时间对一条数据多次修改的情况,这时候即要保证先后顺序,不能出错,还要保证速度极快不把系统卡死(事务性)

· 比如重要的机密数据,要保证不只存在一个地方,甚至不能放在一个城市,但同时还要保证两个城市的数据实时一致,如果一个出问题,几秒钟只能就能切换掉另一个城市的备份。

· 7 8张表,7 8张表里的数据有复杂的关联关系,要快速把这些数据找出来,展示到前台,还不能出错(分析型场景)

这类问题还可以延展很多,更不用说还要兼容各类软硬件等,支撑软硬件热插拔等。

鹅厂的数据库专家张文曾经在一次演讲中提到,今年发布的开源数据库Mysql8.0社区版有130万行代码。130万行代码什么概念?一般的小公司,只是想理解这些代码都做不到,因为填进去的程序员成本太高。

这就是我开头说想突破只能指望大厂的原因。我瞎估下,150万行代码,要想做到理解清楚并能在其基础上做修改,最保守需要40人/年左右,还得是懂数据库的程序员,基本得40个DBA。40个DBA,按便宜的算,每人40万一年综合成本……(已经很少了,相当于2万左右的薪水,大城市的DBA没这么便宜的)

1600万,能把这堆代码搞清楚,而且还没做什么优化开发啊,还没有谈什么推广数据库的市场费用。这么大的投入就算能扛得住,又有几个企业愿意扛这个成本去做这个买卖,冒这个风险。行外人不懂,行内人都知道oracle的统治力,所以真没几个人乐意投入。

所以真的很难。

二、甲骨文为啥这么牛

如果把原因放在前面,我认为三点最重要。1、做的早;2、技术真的牛;3、市场牛。

做的早不说了,美帝的积累自然不是盖的。

技术真的牛,怎么牛?稳定!(业内会讲可用性,可靠性,这里为了行外人看得懂,统一说稳定了)

当然oracle牛x之处不止有稳定,产品体系完善,tp、ap场景通吃(tp就是事务性场景,同一条数据必须做完一件事才能再做下一个,就是让你不能拿只剩100的银行卡花出101去;AP就是分析型场景,希望快速取数据进行分析的场景。)但是甲骨文的最牛之处还是稳定。

这种稳定让甲骨文这么贵的价格都不是事。国内的金融业的核心系统,几乎都在用甲骨文,我知道的除了微众银行用的腾讯的TDSQL,支付宝用阿里的oceanbase以外,没听说还有谁不用oracle。

为啥?稳啊!钱的事出问题就是大事,谁能兜得住,只敢用oracle。我一个10来年的DBA老哥一句话我一直记得“我玩了Mysql一年,出的问题比我玩oracle10年遇到的问题都多。”

这么稳的技术来源于哪?除了甲骨文长期的时间积累,大家都认为一定有牛逼的技术在里面发挥作用。很多技术不是靠时间积累得来的,而是靠灵光一现。想复制这种灵光一现实在太难了。

肯定有人问那国内去O不是要黄?愚以为黄不至于,只是在某些地方特别难。

最早宣传去IOE的阿里真的做到去O了么?去个大头鬼,现在阿里每年还会向甲骨文付很高一笔钱,据说这个买卖是马爸爸亲自和甲骨文老板谈的。虽然说去IOE是极其正确的方向,但是想做到去O,真的要比去I去E难不止一个量级。

但那些地方合适去O?对稳定性没有究极追求的地方都可以去O,或者虽然对稳定要求很高但是有很强运维能力的企业。国内的互联网产业,天然不用oracle,因为互联网产业天然有很强的运维和开发能力,完全可以去O运作。比如政府国企,很多政府IT业务用不用oracle一样渣,早就应该去O。对应的由于金融业对业务稳定性的要求,去O很难。

当然,除了稳定性以外,还有另一个问题,让去O很难推进,那就是业务改造难度太大。每个数据库都有一套程序语言用来操作数据,这些程序代码渗透到业务的方方面面(只要调用数据,就要用数据库),要全面改造这些代码,还想不出问题,何其难也!金融系统很多都是10来年的老代码,维护都难,别说修改了。金融系统改出一个问题,技术leader就该下课了。谁敢换……

三、国产数据库是啥状态?

云时代之前,国产数据库完全不行。云时代之后,由于有腾讯阿里等巨头,能行了。

不客气的说,XX、XXXX等国产数据库,完全靠政府养着,拿到市场上一个能打的都没有。否则在政府、国企央企、军工之外有谁见过XX、XX?最懂技术的互联网有哪怕一家公司用这些数据库么?这些企业也只会去往政府,军工这些行业钻。(上面这段仅代表个人观点)

除了XX、XXXX等企业,像腾讯阿里,还是有些能拿得出手的产品,腾讯的Tdsql、Tbase,阿里的oceanbase等,已经开始在金融等领域进行市场渗透,并拿下了一定的市场份额。正如前面所讲,恐怕也只有这些头部互联网企业才有希望。

云时代之后,我们起码看到了希望。云时代的数据库,主要靠开源数据库撑着。云时代拜两个马爸爸所赐,中国没有落后,数据库又是开源的,谁都不比谁强多少。更重要的是

云是IT基础架构的替代者,是大方向,是趋势

在这上面我们不落后,我们就不会漏掉数据库的下一个时代。亚马逊有Aurora,腾讯阿里就有CynosDB和PolarDB。同样的云原生、分布式、计算存储分离等特性,谁也不比谁差多少。反观Oracle,在云时代实在乏善可陈。

阿里我不清楚,腾讯云数百人的数据库团队,还有散落在其他部门的数据库团队都有很多很强的成果出来。

比如微信这样无敌的用户量和强社交场景,自然也培育出了技术相当强劲的新类型数据库,只不过不知道是不是需要保密,我就不在外面说了。希望将来能通腾讯云把这些技术拿出来给大家服务,体验国产数据库的强大。

Ps:有人问我为啥不说Tidb。Tidb营销上完全在学MongoDB,技术上缺乏善可陈。怎么说呢,不能说Tidb不好,只能说Tidb还需要沉淀。当然Tidb有点非常好,就是告诉国内企业做数据库是有希望的,这激励了很多人!

四、国产数据库能不能行

其实话说到这里,答案前面都已经讲了,这里总结一下吧:

1) 关系型数据库:当前没有跨过这个大山,现在有跨国大山的势能,但是只能指望腾讯阿里了。

2) 云数据库:国内和美国谁都不比谁差。

3) 新兴数据库:内存型、文档型、图、列、时序等数据库,国内不比美国差多少,很多方面国内还有优势。

最后多说一点市场,甲骨文另一点强大,就是有强大的营销能力。产品好+营销强+进入早,这样的优势需要国内厂商用很长的时间才能实现赶超,不可偏废。

最后的最后打一下广告:

Tdsql,腾讯自己的数据库,金融级分布式,大量金融公司在用;

Tbase,PG做底层的数据仓库/数据库,大量金融公司在用;

CynosDB,我们的云原生数据库,对标亚马逊欧若拉,已经有很多大型互联网公司在测试使用,是下一代的数据库产品。

除此之外,还有tdata,Tcaplus游戏专用数据库等数据库产品,欢迎大家尝试。

碎石者大神的论文

经同事提醒,把几个国产数据库厂商的名字隐去了

=================================

挂一个阿里低质量的水军,虽然我腾讯的,但对阿里那么多大牛还是很崇拜的,阿里的数据库也很强。然而,这些脸面都让你给丢尽了。

·本文只提到Mysql,130万行代码,这人全都没看清;

·本文观点是能跨过大山

·本文从没提过代码行数和稳定的关系,讲代码行数是为了说明学习成本高。

三、中国数据库技术的作用?

1、实现数据共享:数据共享包含所有用户可同时存取数据库中的数据,也包括用户可以用各种方式通过接口使用数据库,并提供数据共享。

2、减少数据的冗余度:同文件系统相比,由于数据库实现了数据共享,从而避免了用户各自建立应用文件。减少了大量重复数据,减少了数据冗余,维护了数据的一致性。

3、保持数据的独立性:数据的独立性包括逻辑独立性(数据库中数据库的逻辑结构和应用程序相互独立)和物理独立性(数据物理结构的变化不影响数据的逻辑结构)。

4、数据实现集中控制:文件管理方式中,数据处于一种分散的状态,不同的用户或同一用户在不同处理中其文件之间毫无关系。利用数据库可对数据进行集中控制和管理,并通过数据模型表示各种数据的组织以及数据间的联系。

5、数据一致性和可维护性,以确保数据的安全性和可靠性:主要包括:安全性控制、完整性控制、并发控制,使在同一时间周期内,允许对数据实现多路存取,又能防止用户之间的不正常交互作用。

四、中国科学数据库是什么?

中国科学院科学数据库的内容涵盖了化学、生物、天文、材料、腐蚀、光学机械、自然资源、能源、生态环境、湖泊、湿地、冰川、大气、古气候、动物、水生生物、遥感等多种学科,由中国科学院各学科领域几十个研究所的科研人员参加建设。

科学数据库基于中国科技网对国内外用户提供服务,在中国科技网上已建立了集中与分布的Web站点19个,数据量约3250亿字节(325GB)。

五、中国最大数据库?

企业信用信息基础数据库(简称企业征信系统)是我国社会信用体系的重要基础设施,是在国务院领导下,由中国人民银行组织建立的全国统一的企业信用信息共享平台,

其日常的运行管理由中国人民银行征信中心承担。该数据库采集、保存、整理企业信用信息,为商业银行、企业、相关政府部门提供信用报告查询服务,为货币政策、金融监管和其他法定用途提供有关信息服务。

人民银行推进企业系统建设,最早是从九十年代初开始的。1992年人民银行深圳分行适应企业多头贷款和银行打破专业分工后对贷款信息共享的需要,推出贷款证制度,这项制度1996年推广到全国。

1997年研究建立了银行信贷登记咨询系统。银行信贷登记咨询系统主要从商业银行等金融机构采集企业的基本信息、在金融机构的借款、担保等信贷信息,以及企业主要的财务指标。截止2005年4月底,系统收录借款企业462万户,人民币贷款余额16.3万亿元,约占全国金融机构贷款余额的近90%,基本涵盖了全部企业贷款。

2005年人民银行在银行信贷登记咨询系统的建设基础上启动了全国统一的企业信用信息基础数据库建设。企业信用信息基础数据库采取全国集中式数据库结构,数据采集项由原来的300多项扩展到800多项。今年上半年已实现全国所有商业银行和有条件的农村信用社全国联网运行。

六、中国有哪些生物数据库?

分子生物学数据库大全:核酸数据库、基因表达数据库、蛋白数据库、糖数据库、专利数据库等国际顶尖数据库列表可以在生物帮那里找到的,我一般找资料,最新资讯都是到那里的,他们比较专业,权威,也比较全面,技术文档,视频,产品都蛮丰富的。年来大量生物学实验的数据积累,形成了当前数以百计的生物信息数据库。

它们各自按一定的目标收集和整理生物学实验数据,并提供相关的数据查询、数据处理的服务。

七、中国期刊数据库是什么?

中国期刊数据库:是用于原文传递、信息咨询和信息检索。

《中国期刊全文数据库(CJFD)》是世界上最大的连续动态更新的中国期刊全文数据库,积累全文文献800万篇,提录1500余万条,分九大专辑,126个专题文献数据库。

数据库覆盖范围:理工A,理工B,理工C,农业,医药卫生,文史哲,经济,政治与法律,教育与社会科学,电子技术与信息科学。

八、中国数据库检索的方法?

1 快速检索

提供了类似搜索引擎的检索方式,用户只需要输入所要找的关键词,点击“快速检索”就查到相关的文献。

2 标准检索

在标准检索中,将检索过程规范为三个步骤:一输入时间、支持基金、文献来源、作者等检索控制条件;二输入文献全文、篇名、主题、关键词等内容检索条件;三对检索结果的分组排序,反复筛选修正检索式得到最终结果。

3 专业检索

使用逻辑运算符和关键词构造检索式进行检索,用于图书情报专业人员查新、信息分析等工作

九、中国最大的数据库是啥?

深圳市海问信息网络数据有限公司今天在此间宣布,

已建成拥有800多万条国内企事业单位相关信息的网上数

据库。这是中国目前最大的网上工商企业及社会机关、团

体数据资料库。

十、中国植物数据库由什么组成?

中国植物物种信息数据库, 由植物学学科积累深厚和专业数据库资源丰富的中科院昆明植物研究所、中科院植物所、中科院武汉植物园和中科院华南植物园联合建设,面向国家重大资源战略需求和重大领域前沿研究需求,紧密围绕中科院独具特色、有着长期积累的、成熟的植物学数据库,充分运用植物学、植物资源学和植物区系地理学等有关理论、方法和手段,

在顶层设计的基础上,依靠植物学专家,通过重复验证,制定通用的标准、规范和数据质量保证措施,以中国高等植物为核心,采集、集成、整合现有的各相关数据库,目标是建设一个符合国际和国家标准、有严格质量控制与管理、具有完整性和权威性、具国际领先地位的中国植物物种信息数据库(参考型数据库)。

相关推荐