刘耀铭同学元数据系列作品的第二篇,大家支持!
其他有兴趣的同学也可以联系我一起学习,进步!具体内容参考:
怎么快速提高技术?
其他元数据相关系列文章:
元数据概念
基于元数据驱动的ETL
Hive 元数据表结构详解
上一遍我们了解了什么是元数据,即元数据的定义,我们知道了元数据是对数据的描述以及解释,它用来说明数据内容质量状况和其他特征的背景信息。那么元数据具体有什么作用呢?
1、元数据是进行数据集成所必须的。
怎么理解?我们知道一个数据仓库是由外部数据、业务数据以及文档资料通过某些抽取工具而得到的,数据集市就是数据仓库经过元数据的定义,约定它的结构等信息所产生。元数据做到了对数据仓库有效的数据存储与管理;
2、元数据可以帮助用户理解数据仓库的数据
元数据为运行时的系统提供了统一的可读的系统模型,系统运行时可以使得实体对象通过运行时的元数据模型来得知自身的结构、自身的特征。
3、元数据是保证数据质量的关键
元数据做到了对数据仓库结构的描述,仓库模式试图,维,度量,层次结构,到处数据库的定义,以及数据集市的位置和内容。
4、元数据可以支持需求变化
元数据独立于平台,无论使用什么技术平台,元数据本身不受影响。所以元数据可以支持需求的变化。
5、元数据是独立性强,是与平台无关的,无论使用什么技术平台,元数据自身不收到任何影响,这就保证了元数据的通用性和移植性,能使它发挥最大的效用。
6、元数据是生成其他数据模型的基础,有了元数据,就可以借用相应的代码生成器或者相应的工具生成可直接使用的其他数据模型和代码信息。
7、元数据可以为运行中的系统提供统一的可读的系统模型,使系统在运行时可以使那些实体对象通过元数据来了解其本身的特征、结构、地位以及其他对象之间的关系等。这样可以从一个新的角度来理解、设计和开发系统。
元数据在网络信息资源组织方面的作用可以概括在以后六个方面:描述、检索、选择、定位、管理和评估。
资源描述:元数据的最基本的功能就是对信息资源对象进行描述,这也就是对数据的解释和说明,这里可以描述信息资源的主题、内容、属性、特点等。
资源检索:可以利用元数据更方便快捷地组织信息资源,并建立各资源对象之间的联系。为用户提供更多途径、多层次的检索方式,从而有利于用户更加方便快速地防线自己所真正需要的资源和信息。
资源选择:元数据可以帮助用户更快的进行信息的取舍。在元数据的支持下,用户可以不必浏览信息本身对象,就可以对信息进行基本的了解和认识,并且挑选自己需要的信息,加快了选择信息资源的速度,提高了方便程度。
资源定位:元数据可以为用户提供信息资源本身的位置方面的信息,方便准备地获取信息资源所在的位置,方便信息资源管理。
资源管理:元数据可以用于信息资源的保存和管理,包括资源的加工存储结构、使用管理等方面的信息,也包括使用权、版权所有权、防伪方式、电子签名、电子水印等信息。是信息资源的管理更加正规。权限更加明确。
资源评估:主要是保存信息西苑的使用情况之类的信息,还有被评价的相关信息。研究和管理者就可以利用这些信息对资源进行统计分析,并反馈给资源建立和管理者,使其更好的组织资源,更好的为用户服务。
个人新作《大数据架构详解:从数据获取到深度学习》一书,已由电子工业出版社出版,京东,淘宝,当当,亚马逊全网开售,有兴趣的同学直接上京东,淘宝,当当,亚马逊 搜索书名,详细了解:
为什么写《大数据架构详解》这本书
《大数据架构详解》答疑(一)