主页 > 大数据 > 传统数据库与新型数据库对比?

传统数据库与新型数据库对比?

一、传统数据库与新型数据库对比?

传统数据库

以关系型数据库为代表的传统数据库以完善的关系代数理论作为基础,有严格的标准,支持事务的ACID四中特性,借助索引机制可以实现高效的查询、技术成熟,有专业公司的技术支持。

劣势就是可扩展性比较差,无法较好的支持海量数据存储。数据模型过于死板、无法较好支持Web2.0应用,事务机制影响力系统的整体性能。

新型数据库

新型数据库可以支持超大规模数据存储,灵活的数据模型可以很好的支持Web2.0应用,具有强大的横向扩展能力等。

二、传统数据库与数据库的区别?

传统数据库和数据仓库其实是及其相似的,都是通过某个软件或者框架,基于某种数据模型来组织、管理数据。

数据仓库其实是一种特殊的数据库,它擅长大数据量查询分析,数据加工,存储。而传统数据库更加擅长事务处理,增删改查。

传统数据库保存当下数据,而数据仓库仓库保存了历史数据所有状态。

传统数据库会出现频繁数据更新。而数据仓库提取加工数据用来反哺业务,提供分析决策。

传统数据库擅长事务处理(OLTP)而数据仓库擅长数据分析。

传统数据库主要遵从范式模型(1NF,2NF,3NF,等等),从而尽可能减少数据冗余,保证引用完整性;而数据仓库强调数据分析的效率,复杂查询的速度,数据之间的相关性分析,所以在数据库模型上,数据仓库喜欢使用多维模型,从而提高数据分析的效率。

传统数据库一般是明细数据,而数据仓库包含一些汇总数据。

三、传统数据库结构类型?

1.物理存储结构:

 定义:现实的数据存储单元

 组成:

  (1)数据文件:存储数据库的数据文件

  (2)日志文件:记录对数据进行的修改信息

  (3)控制文件:记录数据库物理结构的二进制文件(包含数据文件和日志文件)

    因此,Oracle实例在启动时,必须访问控制文件

2.逻辑结构

  定义:数据库创建后形成的逻辑概念之间的关系

四、传统数据库有哪些?

有以下几种。

1、目前关系型数据库主要有MySQL、SQLServer、数蚕数据库、Oracle数据库。

  2、MySQL:免费产品,中小企业使用广泛。

  3、SQLServer:微软的商业化产品,微软SQL语句兼容性好,商业化成熟度高。

  4、数蚕数据库:数蚕科技针对中小型企业的数据库,c++接口特性良好,SQL特性较弱。

  5、Oracle数据库:商业化程度最高的关系数据库,优良的性能和企业扩展能力。

  6、非关系型数据库主要有FastDB、Memcached和Redis等主流内存数据库。一般应用于缓存等非关键数据存储,其优点是数据查询速度快,对下层编程接口良好。

五、传统数据库缺乏什么性?

(1)传统数据库系统管理的是不连续的、相关性较小的 数字和字符;而地理信息数据是连续的,并且具有很强的空间相关性。

(2)传统数据库系统管理的实体类型较少,并且实体类型 之间通常只有简单、固定的空间关系;而地理空间数据的 实体类型繁多,实体类型之间存在着复杂的空间关系,并且还能产生新的关系(如拓扑关系)。

(3)传统数据库系统存储的数据通常为等长记录的数据;而地理空间数据通常是非结构化的,其数据项可能很大,很复杂,并且变长记录。

(4)传统数据库系统只操纵和査询文字和数字信息;而地理空间数据库中箱要有大重的空间数据操作和査询,如特征提取、影像分割、影像代数运算、拓扑和相似性査询等。

(5)具有高度内部联系的GIS数据记录需要更复杂的安全 性维护系统,为了保证空间数据库的完整性,保护数据文件 的完整性,保护系列必须与空间数据一起存储,否则,一条记录的改变就会使其他数据文件产生错误。

六、分布式数据库和传统数据库的区别?

时代的发展,使得数据不断增加。传统的数据存储方式远远满足不了需求。想象一下,企业发展过程中,数据越来越多。以往,只能买个存储空间更大的数据库服务器,然后将原有的数据拷贝过去。但这只是一时的补救,并不能满足未来的发展。

我们常常说区块链是分布式数据库,但在这前面要加上“特殊的”这三个字。因为区块链与传统的分布式数据库还是有区别的。

分布式数据库

分布式数据库是将数据分割开来,存储在不同的数据库服务器中,数据多了就多用个服务器。当然,实际当中并不是这么简单的,我们还要考虑服务器之间的链接,怎样快速查找数据等等。

在分布式数据库中,负责存储的服务器节点只存储一部分数据,节点之间是彼此信任的,这些节点组合成一个完整的数据库。

区块链——公有链

公有链运用了分布式存储的技术,它提高了每个节点的权限,每个节点都是个独立的个体。与传统分布式数据库最大的区别是:公有链的节点是彼此制约的。

公有链的节点他们各自就是一个完整的数据库,可以存储公有链上所有的区块数据。由于各节点相互独立,区块链才被称为一个去中心化的分布式数据库。

公有链相对于传统的分布式数据库,有着明晰的优势,由于数据确认需要一半以上的节点共识,使得数据具有不可篡改的特点,而且由于数据存在于多个节点,使得数据理论上是永远不会丢失的。

然而,为了这些优势,公有链存在一些短板。首先,由于每个模块的生成需要多方确认,使得数据生成的效率降低。再一个,虽然区块链采用加密技术来保障用户隐私,然而,由于每个节点都能获得完整的数据,数据是公开的,使得一旦用户泄露了自己的地址,别人就能很容易地知晓其交易记录。

另外,由于每个节点都能存储所有的数据,造成了不必要的浪费,使得数据冗余。

区块链的进化版——T-ABC联盟链

联盟链的特点是区块链由联盟中的成员进行管理。成员推选出1个或多个预选节点负责记账,使得记账由无数个节点限制到有限的节点,大大提高了效率,且保留了不可篡改的特点。而其用户节点只有查询和交易功能,并未存储所有数据。用户想要查询记录,不仅需要地址,还要有对应的私钥,很好地保障用户的隐私。

我们都知道数据在区块链中是分为一个个区块存储的。T-ABC中的普通节点是没有存储所有区块的,每个区块都是从上亿个节点中随机抽取6个节点存储。避免了数据的大量冗余。

有人会问,如果这6个节点都坏了,数据不就丢失了吗?为此,每当一个节点损坏或断网,整个系统会将其存储的数据再随机同步给其他节点,使得每个区块在整个系统中都有6个节点记录,使得数据不会丢失的。

T-ABC联盟链通过由联盟成员管理,限制普通节点查询权限,普通节点不存储完整数据。在分布式数据库基础上,优化了数据不可被篡改,让数据更可信,赋予了节点更高的权限。

七、传统数据库存储大数据有哪些困难?

目前大数据行业的从业者通常有三种收集数据的手段,第一种是通过互联网来收集信息,这种方式是最基本的数据收集方式,虽然互联网数据本身存在真假难辨等问题,但是从大的方面来看,互联网数据对于行业发展的趋势预测具有重要的意义,所以不少大数据公司都比较注重互联网数据的收集和分析,一些行业分析报告也会依赖于互联网信息的分析结果。

第二种收集信息的方式是与行业企业的合作,这种方式是目前获取高附加值信息的重要手段,也是比较有效的手段。比如行业企业想进行大数据改造,但是自身的技术能力又不允许,同时还想降低大数据改造的成本,此时通过自身的数据来于大数据企业进行合作是比较不错的选择。

目前行业内的数据合作范围还是比较广泛的,当然数据合作本身也存在一定的风险,通常数据在交换的过程中往往会经过一系列技术操作,最常见的操作就是“脱敏操作”。对于一些涉及到个人隐私的数据,脱敏是必须进行的操作,但是脱敏操作并不会影响大数据分析的进行,所以脱敏并不意味着数据价值的降低。实际上,在脱敏的过程中,还可以对数据进行一定的整理操作(清洗、归并等),从而方便进行数据分析。

随着大数据的重要程度不断提升,目前一些掌握在管理部门手中的数据,也陆续开放了出来,这些数据对于大数据从业者来说也非常重要,而且这些数据的价值密度往往也比较高,这也是促进大数据发展的一个重要手段。

八、Hbase和传统数据库的区别?

HBase与传统关系数据库的区别?

答:主要体现在以下几个方面:1.数据类型。关系数据库采用关系模型,具有丰富的数据类型和储存方式。HBase则采用了更加简单的数据模型,它把数据储存为未经解释的字符串,用户可以把不同格式的结构化数据和非结构化数据都序列化成字符串保存到HBase中,用户需要自己编写程序把字符串解析成不同的数据类型。

2.数据操作。关系数据库中包含了丰富的操作,如插入、删除、更新、查询等,其中会涉及复杂的多表连接,通常是借助多个表之间的主外键关联来实现的。HBase操作则不存在复杂的表与表之间的关系,只有简单的插入、查询、删除、清空等,因为HBase在设计上就避免了复杂的表与表之间的关系,通常只采用单表的主键查询,所以它无法实现像关系数据库中那样的表与表之间的连接操作。

3.存储模式。关系数据库是基于行模式存储的,元祖或行会被连续地存储在磁盘页中。在读取数据时,需要顺序扫描每个元组,然后从中筛选出查询所需要的属性。如果每个元组只有少量属性的值对于查询是有用的,那么基于行模式存储就会浪费许多磁盘空间和内存带宽。HBase是基于列存储的,每个列族都由几个文件保存,不同列族的文件是分离的,它的优点是:可以降低I/O开销,支持大量并发用户查询,因为仅需要处理可以回答这些查询的列,而不是处理与查询无关的大量数据行;同一个列族中的数据会被一起进行压缩,由于同一列族内的数据相似度较高,因此可以获得较高的数据压缩比。

4.数据索引。关系数据库通常可以针对不同列构建复杂的多个索引,以提高数据访问性能。与关系数据库不同的是,HBase只有一个索引——行键,通过巧妙的设计,HBase中所有访问方法,或者通过行键访问,或者通过行键扫描,从而使整个系统不会慢下来。由于HBase位于Hadoop框架之上,因此可以使用Hadoop MapReduce来快速、高效地生成索引表。

6.数据维护。在关系数据库中,更新操作会用最新的当前值去替换记录中原来的旧值,旧值被覆盖后就不会存在。而在HBase中执行更新操作时,并不会删除数据旧的版本,而是生成一个新的版本,旧有的版本仍旧保留。

7.可伸缩性。关系数据库很难实现横向扩展,纵向扩展的空间也比较有限。相反,HBase和BigTable这些分布式数据库就是为了实现灵活的水平扩展而开发的,因此能够轻易地通过在集群中增加或者减少硬件数量来实现性能的伸缩。

但是,相对于关系数据库来说,HBase也有自身的局限性,如HBase不支持事务,因此无法实现跨行的原子性。

注:本来也想来问这个问题,然后复制一下的。结果找不到,只好自己手打了,麻烦复制拿去用的同学点下赞呗。

九、传统关系型数据库有哪些?

很多。sqlserver Oracle MySQL postgresql

十、传统数据库结构主要有?

1.物理存储结构:

 定义:现实的数据存储单元

 组成:

  (1)数据文件:存储数据库的数据文件

  (2)日志文件:记录对数据进行的修改信息

  (3)控制文件:记录数据库物理结构的二进制文件(包含数据文件和日志文件)

    因此,Oracle实例在启动时,必须访问控制文件

2.逻辑结构

  定义:数据库创建后形成的逻辑概念之间的关系

  表空间(逻辑组件Tablespase):是Oracle数据库存储数据的逻辑单位

相关推荐