主页 > 大数据 > 数据资源梳理的书?

数据资源梳理的书?

一、数据资源梳理的书?

有:深入浅出统计学,MySQL必知必会,精益数据分析等。

二、数据资源目录标准?

企业数据目录(EDC)旨在帮助企业与IT人员通过统一的元数据视图(包括技术元数据、业务元数据、用户释义、关联关系、数据质量和用途)来释放企业数据资产的最大能量。

我们从下至上来看下EDC的一个架构,最下面是存储层,在这一层,EDC包含了传统的结构化数据库用来存储EDC的管理员数据、可视化配置数据、数据域的规则,runtime统计数据等等,其中一部分结构化数据来自于各接入应用的元数据,称为模型库服务(Model Repository Service,MRS)使所有接入的应用可以在一个关系型数据库中进行协同;另一部分结构化数据称为数据剖析仓库(Profiling Warehouse,PWH),用来存储数据剖析信息,例如剖析结果和计分卡结果。在存储层EDC也可以接入各种非结构化数据,例如Hadoop分布式存储系统以及其上的HBASE等开源产品。

往上一层,对于接入的结构化数据的数据源,有剖析引擎(Data Profiling Engine)对数据集的唯一性,特征值频率以及数据集所属的数据域进行分析;在另一边Hadoop社区有自己的分布式引擎系统,例如用来快速将各类元数据加载到HBase的Spark组件,以及支持多条件搜索并建立实时索引的Solr组件。

所有的数据处理都是为了能提供数据服务,最通用的不外乎搜索,包括数据间关系、血缘的搜索,数据域的搜索。还有就是生成报表作业的管理计划。除了直接对外提供服务外,这一层还有一些插件对数据进行进一步加工,例如对跨数据集的数据相似性进行比较的分析器,对数据集进行到数据域的归集,以及将非结构化元数据导入到HBase的摄入服务。最终服务层有统一的对外API接口将数据域转化成数据目录作为EDC的主体。

三、数据资源目录是什么?

我国的数据资源目录概念源自于政务信息系统。早在2002年国家相关部门就制定了政务资源管理的相关规范和标准。

请参考GB/T 7027-2002信息分类编码的基本原则和方法[31];GB/T 21063-2007政务信息资源目录体系[32]。

政务数据资源目录是通过对政务信息资源依据规范的元数据描述,按照一定的分类方法进行排序和编码的一组信息,用以描述各个政务信息资源的特征,以便于对政务信息资源的检索、定位与获取。

四、大数据资源目录

大数据资源目录是指一个包含各种大数据资源的集合,这些资源可以帮助企业和组织进行数据分析、挖掘和应用。随着大数据时代的到来,越来越多的组织意识到了数据的重要性,因此建立一个完善的大数据资源目录变得至关重要。

大数据资源目录的作用

大数据资源目录的作用主要体现在以下几个方面:

  • 整合资源:大数据资源目录可以集成各种不同来源的大数据资源,包括结构化数据、非结构化数据、实时数据等,为用户提供一个统一的访问入口。
  • 可视化管理:通过大数据资源目录,用户可以直观地了解各种数据资源的类型、来源、版本等信息,实现对数据资源的可视化管理。
  • 提升数据利用率:通过大数据资源目录,用户可以快速查找到所需的数据资源,节省了查找数据的时间,提升了数据的利用率。
  • 数据共享与合作:大数据资源目录可以促进数据共享与合作,不同部门、不同团队之间可以更加方便地共享数据资源,实现协同工作。

建立大数据资源目录的关键要素

要建立一个高效的大数据资源目录,需要考虑以下几个关键要素:

  • 数据分类:对数据资源进行合理分类,可以根据数据的类型、来源、用途等特征进行分类,便于用户快速找到所需信息。
  • 数据描述:每个数据资源都应该有详细的描述信息,包括数据的内容、格式、更新时间等,帮助用户更好地了解数据资源。
  • 数据权限管理:对不同的数据资源设置不同的访问权限,保护数据的安全性,防止未经授权的访问。
  • 数据质量保障:对数据资源进行质量评估,确保数据的准确性和完整性,提高数据的可信度。

大数据资源目录的搭建与优化

建立和优化大数据资源目录需要考虑以下几点:

  • 选择合适的数据目录平台:可以选择开源或商业的数据目录平台,如Apache Atlas、Collibra等,根据实际需求选择最合适的平台。
  • 数据接入与集成:确保各种数据源能够顺利接入到目录中,实现数据的集成和统一管理。
  • 数据搜索与发现:提供强大的搜索功能,支持关键词搜索、多条件筛选等,让用户能快速找到所需的数据资源。
  • 用户权限管理:设定不同用户的访问权限,保障数据的安全性,同时支持数据共享与合作。
  • 监控与优化:定期监控大数据资源目录的运行情况,对目录进行优化改进,提高数据服务的效率和质量。

大数据资源目录的未来发展趋势

随着大数据技术的不断发展,大数据资源目录也会朝着更加智能、自动化、个性化的方向发展:

  • 智能推荐:基于用户行为和偏好,为用户推荐相关的数据资源,提高数据资源的利用率。
  • 自动化管理:实现数据资源的自动化管理和维护,减少人工成本,提高工作效率。
  • 个性化定制:支持用户根据自身需求定制数据目录的显示界面和功能模块,提供个性化的数据服务。
  • 数据治理:加强对数据资源的管理和治理,确保数据的安全性和合规性。

大数据资源目录作为大数据管理的重要组成部分,对于企业和组织来说具有重要意义。建立和优化一个符合实际需求的大数据资源目录,可以帮助企业更好地利用数据资源,提升数据应用的效率和价值。

五、数据运营如何梳理数据埋点需求?

数据分析数据治理入门分享-转载渭河数分星球嘉宾SpaceLion的文章(四年互联网大厂数据科学经验),未经许可不能转载

三天无理由退款

1、前言

看到这个标题可能有的同学会有疑惑,为什么我作为数据分析师还需要去管数据治理的活,这个不是会有专门的同学去做吗?

确实,在很多大厂,数据开发和数据分析职能都是分开的,数分的同学一开始拿到的表就是已经清洗过的宽表,BI看板搭建就是写几条sql配置一下,日志埋点的工作都会交给产品来完成。但是很多中小公司是不具备这种条件的,尤其是很多初期的创业公司,在产品架构尚未完善,团队分工不够明确的情况下,很多时候日志埋点,数据清洗的工作都会落到数据分析同学的身上。

在择业的时候,遇到这种分工尚未明确的项目,可能有一部分同学就直接放弃了,有的同学可能会说:我想专精数据分析,不想在数据治理上花时间,我找一个分工明确的团队就行了,如果职能分工不明确,说明这个项目的老板不懂数据等等诸如此类的。当然这也是没问题的,人的精力是有限的,追求知识的深度那必定会导致广度的不足。

不过从我个人的角度来看的话,这样可能就会使我个人的择业范围受限,只能选择一些数据建设相对较好的团队。另一方面,如果能够懂得一些数据治理的方法,那么在一些场景下也能够给数据分析工作带来一些便利性,包括能够让数据分析人员更好地定义口径,在复杂的统计任务中通过埋点和数仓来解决问题等。例如,一个刚刚搭建起来没多久的电商APP,想要分析用户点击下单之前上一个页面来自于哪里,假设我只在应用层面解决,那我可能需要把用户的点击事件按照时间排序,再进行清洗计算,费时费力。但是这个时候如果我通过埋点解决这个问题,让程序在用户的点击事件日志上加入一个refer字段,记录了上一个页面的url,这样无论是统计分析,还是搭建后续的BI能力,都能够快速解决

因此本篇随笔的目的就是分享一些本人在数据治理方面的入门经验,希望能给到一些完全没接触过数据治理的同学一些帮助。

2、数据治理链路以及数分同学参与的环节

国际数据管理协会DAMA对数据管理的主题分类可以分为以下几种类型:数据治理、数据架构、数据建模和设计、数据存储和操作、数据安全、数据集成和互操作、文件和内容管理、参考数据和主数据、数据仓库和商务智能、元数据、数据质量。而对于这些工作的从层次划分,网上有各种不同的概念,毕竟不同的公司架构不太一样,我们在这里引用《大数据之路:阿里巴巴大数据实践》书中的数据体系。整个架构分为四个层次:数据采集层,数据计算层,数据服务层,数据应用层。

1、数据采集层:包括日志收集,数据库,数据同步;

2、数据计算层:包括离线数据计算,数据仓库,实时数据

3、数据服务层:基本上就到了我们比较熟悉的环节,包括数分同学平时能拿到进行分析的mysql数据源,hive数据源,数仓的cube等等,数分同学的大部分工作,可能就是拿着这些数据源去做数据应用层的东西,不管是统计分析还是数据建模。

4、数据应用层:这里就是到了一些应用层的数据,对线上产品的,对内部系统的等等

在整条链路中,一些纯技术向的,涉及线上开发的内容是不用数分的同学参与的,一般数分的同学可能参与的环节主要在日志埋点和数仓设计两部分,参与的深度视实际需求会有灵活的变化。

3、日志埋点

3.1 数分同学参与日志埋点工作的优势

在日志收集环节,数据分析师可能会参与到日志埋点工作当中,有些尚没有实际工作经验的同学可能不太清楚,线上产出的原始数据都是json或者双逗号分割等不同类型的的字符串,其中定义了每一个字段的key-value,需要经过清洗才能够变成我们常用的数据表格式。那么一般数据分析师要做的就是配合产品运营,定义清楚每一条日志的上报机制,以及对应的key-value含义。

有的同学会讲这个东西不是应该产品自己来搞吗?没错一个基础能力强的产品确实是能够承担埋点的工作,并且产品功能是他设计的,他比谁都更清楚功能上线之后他想要知道哪些信息,对应所需要埋哪些点。但是有的时候一些产品虽然懂得功能设计和交互,但是却不太懂数据,他们想要的可能是一个抽象的概念,比如功能上线之后他想知道用户的活跃,用户的漏斗转化,此时如果没有专门的数分同学参与,那么产品估计就会去找开发,开发可能更了解底层架构,但是不了解业务,如果没有定义清楚日志上报机制和含义,那么可能就会出现这样一种情况:

产品上了一个促销活动的页面希望知道用户的PV,以及页面带来的GMV,开发随便埋了一个服务端日志,只要用户发送了访问页面请求就记录一条,结果数分同学统计出来发现PV量巨大,但是GMV少的可怜,于是产品疯狂优化交互,但是GMV依旧没有什么提升。最后经过多方排查发现,原因是由于前端页面加载问题导致很多用户虽然请求了链接,但是页面素材却加载不出来,而PV统计的是服务端日志,也许后面的转化其实还可以,但数据口径的差异导致了整个问题的误判。

以上这个例子是我编的,但是参考了一些工作当中踩过的坑点,我们可以发现在产品或者技术自身能力不够强的时候,把埋点全权交给他们就容易出现数据统计口径不明确的问题。而反过来看,数据埋点也是要为业务服务的,最好是通过需求和数据指标反推需要什么埋点,这就决定了数据分析的同学在这个环节当中有着很大的参与空间,其意义在于:

1、明确埋点机制对应的数据指标口径,避免业务分析的偏差。

2、帮助数分同学了解底层架构,拓展业务分析当中的思路。

3、数分同学可以自主增加便于分析的日志埋点,提升效率。

3.2 日志埋点的经验分享

埋点的方法根据每个公司使用的数据服务不同也有很大差异,我个人将埋点方法分为两类:全埋点,代码埋点。代码埋点又分为前端和服务端埋点

全埋点就是部署了一些sdk,能够把APP的所有行为全部记录下来,然后由分析人员自定义关键事件,直接圈选分析。使用这种方法一般是接入了一些外部的数据服务供应商的系统,比如神策之类的,优点是你想怎么定义都行,无需重新开发,缺点就是这么多数据占用空间大不能存太久,也只适合一些轻量级的项目分析,我自己是没用过这种方法。

代码埋点顾名思义就是需要让开发把一些关键事件信息的返回写到代码里面去,需要预先定义好在什么场景下,返回一些什么字段,这个就是我们最常用的一种方式。

前端埋点主要是在APP客户端,或者网页页面当中,触发了一些关键素材时返回日志,比如页面加载,素材图片的加载,按钮的点击之类的。这类埋点上报会受到页面改版,网络等问题的影响,会有一些误差;服务端埋点指的是成功请求了一个服务器接口时返回日志,这种日志通常是最准确的,比如下单,播放视频等,请求成功了就是成功了,不受前端改版等问题的影响。

设计埋点的时候我一般遵循这几个步骤:

第一步肯定是要跟产品运营对齐,看一遍产品文档,新功能页面做了什么改动,新增改动了什么功能,是否需要添加前端或服务端埋点;然后再明确这个功能上线之后要看哪些核心的数据,分别需要在前端和服务端埋一些什么内容,确保功能上线能够统计到对应的数据。输出好需要哪些字段之后,需要跟开发对齐,在什么情况下上报,字段都能不能上报,可能有些字段是记录不了的要怎么处理,这些明确了之后才能进入开发。

对于日志字段的设计,个人的经验是可以按照几个大类进行梳理:

维度信息备注
日志基础信息日志唯一标识,日志id,事件id,事件类型等用作日志的分区字段
页面信息名称,title,模块,链接等一般前端需要的较多
用户基础信息用户id,设备信息(设备号,型号),操作系统(语言,版本),网络信息(ip等),应用信息(版本,包体信息)等等有些敏感信息不一定能获取到,用户明文账号等信息注意加密
时间信息日志上报时间,上传时间,更新时间,创建时间如果是一次性的事件则记录上报时间即可,但是如果记录对象是可累积更新状态的,例如订单等,则需要记录不同状态的时间
业务关键信息比如如果关注用户增长,就可以记录点击来源,渠道等信息,如果关注用户的停留消费,那可以记录时长,下单金额;如果是有用户跟另一个对象交互的日志,比如用户-物品,用户-视频,那就需要记录商品id,视频id等等这块不是公共参数,可以根据业务的不同定义去定义
拓展字段可以留出一个空的desc或者info字段,未来业务有新增需求的时候,可以在这个字段当中以json字符串的形式进行拓展

以这样的标准去写埋点文档,就有利于拉齐大家对埋点的认知,从而更高效,准确的沟通。核心的逻辑是从产品对UI的理解过渡到数据指标的设计然后到具体的开发环节,所以需要三方都要听得懂

最后成型的埋点文档应该长下面这样

日志基础信息页面信息具体字段UI图
事件事件类型名称模块记录字段记录值
首页浏览page_view首页曝光公共字段包含用户id,设备号,时间页面id等首页ui图
游戏id如果首页属于某个游戏或者某个商品

4、数据仓库

4.1数分同学参与数仓的优势

数据仓库一般跟数据存储,数据安全这些职能是绑定的,所以大部分工作会落到数据开发的同学身上。不过这种情况是在数据体系已经有一定沉淀的基础上,如果是从零到一的数据仓库搭建,数据分析同学的参与空间也是很大的。

数据开发的同学擅长将数据仓库设计的高效,可拓展,可维护,但是在服务层和应用层当中要结合业务进行设计,比如对于一个短视频产品,数开的同学能够做到让上数十亿条数据的用户-视频维度的事实表清洗任务时长缩短一半,但是到了服务层以上,需要定义一些“近30天用户活跃天数”,“近90天用户观看时长”的时候,数据开发的同学可能就会不知道怎么去设计能更加贴合业务了,此时就需要数分的同学参与进来。

4.2 数仓设计的经验分享

数据仓库一般分为:

1、ODS层(数据准备层):包含业务的原始日志,是直接接入数据源的部分。

2、DWD层(数据明细层):将DW层(DWD,DWM,DWS)与业务层(ODS)隔开的部分,在数据字段的定义上与ODS层保持相同的颗粒度,但是会把ODS层的原始JSON等字符串日志进行解析变成数据库表,同时会做一些空值填补等数据清洗操作。

3、DWM层(数据中间层):在DWD的基础上做轻微的聚合,计算出相应的统计指标,例如假设对于一个短视频产品,DWD层记录的是,用户-创作者-作品-时长的维度数据,并且当一个用户多次观看同一个视频,可能会产生多条记录,那么在DWM层可能会根据业务需要把表聚合为用户-创作者-时长的维度数据,每一对用户-创作者的只会对应一条记录。

4、DWS层(数据服务层):在DWM的基础上整合的主题数据表,例如上面说的用户-创作者-时长的中间表,可能会根据业务需要被聚合为用户主题表:用户-总时长-创作者人数....;创作者主题表:创作者-用户数-总时长......;这里的数据维度通常就已经是具有业务含义的数据指标了

5、ADS层(数据应用层):这里主要是给提供给产品或者数据分析的表,比如BI展示的数据指标表,以及一些为了方便快速分析预聚合好的数据表,其数据指标自定义程度也会更高,比如”近90天观看视频数”等等。

通俗地说,数据仓库从下层往上层设计的过程就是一个不断group by的过程,从多条明细group by成一条,从N个维度group by成一两个维度如何选择维度,以及要group by出哪些指标,就是数据分析同学发挥作用的地方。一般ODS,DWD这两个维度可以不需要数分同学参与,数据开发的同学保证数仓的准确性和稳定性即可,但是到了DWM层数据分析的同学就可以适当参与进来。比如此时DWM层待聚合的维度有20个左右,包括用户id,创作者id,视频信息,用户的机型设备IP这些,那么数分的同学就可以结合平时的分析经验挑选需要聚合哪些维度,比如IP,机型,如果在分析当中并不是一个主要的维度,那么在DWM层当中就无需保留,那么假设数分的同学平时要经常统计“活跃设备数”这样的指标,那么设备ID就需要在DWM层保留下来。

设计数据仓库的过程这里介绍Kimball的维度建模步骤:

1、选择业务过程:这个步骤通俗地讲就是业务场景,比如在某个直播产品当中,我们定义一条用户的核心业务路径定义为观看直播-付费充值-礼物打赏,那么最初的事实表就需要确定是单一场景的观看直播行为表,还是观看直播-付费充值两个场景叠加的表。

2、声明粒度:确定主键,比如在上述的观看直播行为表中,我们选择用户作为粒度。

3、确认维度:根据关联分析的常用维度挑选字段,比如以用户为粒度的表中,我们通常会关注用户看了哪些主播,在什么渠道下看的,看的什么类型,那维度就需要包含主播id,渠道来源,直播品类,核心考量的就是业务相关性。

4、确认事实:也就是确定业务的度量指标,比如观看直播场景下,业务需要关注时长,PV,那么就需要在聚合的过程中把这两个指标计算出来。

如果按这个过程无限拓展,数仓的维度是可以拆出非常多的,常用的模式有:

模式特点维护难度使用广泛度
星形模式以事实表为中心,全部的维表直连在事实表上
雪花模式维度表可以拥有其他的维度表
星座模式基于多张事实表,共享维度信息

无论是哪种,其实核心都是要在存储空间和业务便捷性当中找到一个平衡点,维度表越多,分析的便利性就更强,但是同时增加了存储成本;维度设计的简单,数仓运行更高效,但是可能每次做稍微复杂的分析都要从最底层的表开始用起,降低分析效率。这一块工作是需要数据分析和数据开发的同学长期共建的,数分同学提供业务视角的建议,数开的同学提供技术上的方案,单一方我觉得都很难把这块做好。

5、数据治理-数据分析共同进化

其实分享了这么多,其实核心都是希望能够给数分的同学提供一些跳出数据分析框架解决问题的思路,如果能够了解一些数据治理的基础方法,在一些关键的节点上就可以寻求数据开发的帮助。例如你在分析用户路径的过程中发现了一个很关键的行为,比如用户在浏览3次以上商品详情页之后,购买率会提升10%,那么是不是可以设计对应的埋点,在每次用户曝光商品时,让开发同学记录当天已曝光该商品的次数,产品也可以直接读取这个数据做对应的干预策略;又例如某个视频产品的数仓以前只有简单的用户-创作者-视频维度的事实表,结果最近运营总是提需求看不同MCN机构的数据表现,那我们是不是可以给数仓的同学提需求增加对应的字段或者设计新的事实表和维度表,方便后续的BI能力搭建。

反过来说,数据开发的同学也能得到业务经验的反哺,我发现商品曝光次数是一个非常关键的行为,那么我在下次打其他埋点的时候,也可以建议产品加上这个数据;我发现业务方经常看A维度数据不看B维度的数据,那我也可以设计一些更加便捷的维度表给他们用。

整体来说,我觉得对于数据治理这项工作,数分和数开的同学是一个相辅相成,共同进化的合作关系,如果未来大家在做项目的时候,遇到了需要自己参与到数据治理工作当中的情况,希望本文可以给到大家一些启发。

六、公共服务信访局梳理目录

在一个快节奏的现代社会中,公共服务信访局扮演着至关重要的角色。它通过提供各种服务和解决人们的问题,确保公民的权益得到保障。这些机构的目录是一个重要的工具,它帮助公众了解这些服务和资源的范围和途径。

公共服务信访局目录的作用

公共服务信访局目录的主要目的是提供准确、全面的信息,使公众能够迅速找到所需的服务和支持。这些目录通常包含各种部门和机构的联系方式、地址、工作时间等信息。通过提供这些细节,公众可以更便捷地与机构取得联系,并获取相关的帮助和指导。

此外,公共服务信访局目录还可以帮助政府机构更好地了解公众的需求和关切。通过对目录中的数据进行分析,政府可以更好地规划和优化公共服务的提供,以更好地满足人们的需求。

公共服务信访局目录的内容

公共服务信访局目录通常包含多个类别的服务和资源。以下是一些典型的类别:

  • 卫生服务:包括医院、诊所、药房等相关的机构和服务。
  • 教育服务:包括学校、大学、图书馆等教育机构和资源。
  • 就业服务:提供就业机会、职业培训和求职支持的机构。
  • 社会保障服务:提供社会救助、福利和养老保险等服务的机构。
  • 法律服务:包括法院、律师事务所和法律援助等法律资源。

这些类别仅仅是公共服务信访局目录中的一部分,实际上还包含了更多的服务和资源。不同的地区和国家可能有不同的领域和分类,以满足当地公众的需求。

如何使用公共服务信访局目录

使用公共服务信访局目录非常简单。以下是一些常用的步骤:

  1. 确定需求:首先,明确自己的需求,确定想要寻找的特定服务或资源。
  2. 查找目录:使用公共服务信访局的官方网站或专门的移动应用,查找相关目录。
  3. 选择类别:在目录中选择与您需求相关的类别或关键词。
  4. 浏览结果:查看目录生成的结果列表,筛选出与您需求最符合的选项。
  5. 获取详细信息:点击选定的机构或服务,获取详细信息,包括联系方式、地址和可用时间。

通过按照以上步骤使用公共服务信访局目录,公众可以更快速地找到所需的服务和资源,解决问题,并得到相关支持。

未来公共服务信访局目录的发展方向

随着科技的不断发展,公共服务信访局目录也在不断演变和改进。以下是一些可能的发展方向:

  • 在线服务:公共服务信访局目录将更多地转向在线平台,使用户可以通过互联网访问和使用。
  • 个性化推荐:目录将更加智能化,根据用户的需求和兴趣推荐相关服务和资源。
  • 用户反馈:公众可以通过目录平台提供反馈,分享他们的体验和建议,帮助改善和优化目录的功能。

这些发展方向有助于公共服务信访局目录更好地服务公众,提供更便捷、高效的服务和资源。

总结

公共服务信访局目录对于公众和政府机构来说都是至关重要的。它提供了关键的信息和指导,帮助公众解决问题和获取相关服务和资源。通过不断改进和发展,公共服务信访局目录将成为一个更加智能化、个性化的工具,为公众提供更好的支持。

七、数据目录是什么?

数据目录是所有数据的系统性列表,以表、文件、报告等形式存在于公司的各种源系统中。它的工作原理很像时装目录,但它没有详细介绍泳装或鞋子,而是从一家公司的ERP、人力资源、财务、电子商务系统以及社交媒体源获得信息。目录还显示了所有数据实体的位置。

    数据目录包含关于每个数据片段的大量关键信息,比如数据的概要(关于数据的统计或信息摘要)、沿袭(数据如何生成)以及其他人对它的看法。目录是数据分析师、数据管理员、数据科学家和其他人员寻找和理解相关数据集以建立洞察、发现趋势和为公司确定新产品的切入点。

八、数据资源特点?

数据资源的特点:

数据量大、类型繁多、价值密度低、速度快、时效高。1、数据量大(Volume):大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。2、类型繁多(Variety):包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。3、价值密度低:如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。4、速度快、时效高:这是大数据区分于传统数据挖掘最显著的特征。

九、大珰的人物关系梳理?

这篇文的不同之处在于两个主角的身份设定,一个是太监,并且是清冷孤傲,手握重权的大珰,但他却不谙情事,在感情上是一张白纸。(清冷美人受)另一个是探花,是个被贬后在兵部任职的小官。

两个人因缘邂逅,用书信传情。在这里夸一下童子大大,在她的文字下,角色的情爱痴缠描写得特别到位,扣人心弦。尤其是两个人的暧昧期,那叫一个情意绵绵,无论是环境描写,亦或两人的对话、动作,还有留白,把两人那种隔着纱、但爱意却在不经意间野蛮生长的氛围塑造的恰到好处,仿佛隔着屏幕那爱意就要溢出来了。桃花林里仅仅是一个拥抱和亲吻,便将那种小心试探但情感又悄悄泄露的氛围描写的太好了。

十、什么是选择数据目录?

数据目录是数据库服务器存放数据文件的地方,不仅包括有关表的文件,还包括数据文件和的服务器选项文件。不同的分发,数据库目录的缺省位置是不同的。

相关推荐