作业3 | 结构化数据、非结构化数据、半结构化数据
程序员文章站
2022-06-01 21:34:04
...
一、结构化数据
结构化数据是指具有一定结构性、可以划分为固定的基本组成要素、能通过一个或多个二维表来表示的数据。
一般存储在关系数据库中,具有一定逻辑结构,可用关系数据库的表或视图表示,一般使用关系型数据库来管理结构化数据,极大地方便了人们的日常生活和工作。
例如:传统的关系数据模型、行数据等。
二、非结构化数据
非结构化数据是指结构化数据以外的数据,数据结构不固定,无法使用关系数据库存储,只能够以各种类型的文件形式存放。
非结构化数据通常无法直接知道其内容,必须通过对应的软件才能打开浏览。数据库也只能将它保存在一个BLOB字段中,对以后的数据检索造成了极大的麻烦。而且该数据不易理解,无法从数据本身直接获取其表达的意思。非结构化数据没有规定的结构,不能将其标准化,不易于管理,所以查询、存储、更新以及使用需要更智能化的系统。
例如:各种文档、图片、音频、视频等。
三、半结构化数据
半结构化数据是介于结构化数据和非结构化数据之间的一种数据形式,是具有结构的数据,但是结构变化很大,因此该数据不能简单地组织成一个文件按照非结构化数据处理,也不能简单地建立一个表与它对应。它一般是自描述的,数据的结构和内容混在一起,没有明显的区分
例如:XML、HTML等。
参考:万*. 非结构化到结构化数据转换的研究与实现[D].西南交通大学,2013.
上一篇: 【转】结构化、半结构化和非结构化数据