Oracle数据库处理多媒体信息
引文:
长期以来,多媒体信息在计算机中都是以文件形式存放,由操作系统管理的,但是随着计算机网络,分布式计算的发展,对多媒体信息进行高效的管理,存取,查询已经成了一种迫切需求。而关系数据库却有着强大的数据管理能力。两方面结合,多媒体数据库由此应运而生。本文将就oracle对多媒体信息进行处理的方式,工具,特色以及一些基本原理做一个综述。
但是我们不能不遗憾的看到,现有数据库对一些多媒体数据所特有的操作能力还是很有限的。针对多媒体数据库的性能调优现在也遇到了新的问题。虽然如此,多媒体数据库仍旧产生了广阔的应用价值和前景。
当然本文不可能面面俱到,有关oracle多媒体信息处理的具体内容,请查阅oracle相关手册。
一.应用前景综述
随着计算机处理能力的大副提高,多媒体早已经融入到了计算机当中了,如果缺少了多媒体,缺少了各种多姿多采的图象,音频,视频,很难想象计算机如今会走入千家万户。长期以来,多媒体信息在计算机中都是以文件形式存放,由操作系统管理的,但是随着计算机网络,分布式计算的发展,这种单纯的文件式管理已经力不从心了,对多媒体信息进行高效的管理,存取,查询已经成了一种迫切需求。而关系数据库却有着强大的数据管理能力。两方面密切结合,多媒体数据库由此应运而生。可以预见,随着多媒体处理需求的加强,多媒体数据库的应用将越来越广泛。
oracle作为一家著名的数据库厂商,在多媒体信息处理上,更是走在了前边。本文将就oracle对多媒体信息进行处理的方式,工具,特色以及一些基本原理做一个综述。希望对读者有所启发。当然,关系数据库还有好多家,虽然开发工具,编程接口语句各异,但在数据类型、处理方式上比较相似。所以我们在此略过。
二.多媒体数据类型介绍
在关系型数据库中,多媒体信息等大型对象是由lob型字段来进行存取的。在oracle8i中,正式引入了此标准,以适应多媒体大对象处理的需求。oracle数据库中,lob型数据有以下几种:
--------------------------------------------
lob类型 说明
clob: 和oracle7的long型相似,clob可以存储单字节型数据
nclob: nclob存储定宽的多字节国家字符集数据
blob: 和oracle7中的long raw类型相似。可以存储无结构的二进制数据。oracle8没有对这种数据进行解释 ,只是按照原来的形式存储和检索它。
bfile: bfile允许对oracle数据库以外存储的大型二进制文件进行只读形式的访问。和其它三种lob类型数据 不同的是,bfile类型数据存储在一个单独的文件中,该文件不由oracle来维护。
特点:
1.在oracle7中,相应的long或long raw字段有2g的限制,而lob的限制是4g 。
2.lob可以使用调用接口oci或者由pl/sql利用dbms_lob包进行操纵。
3.lob不象long型那样每个表中最多只有一个字段的限制,其可以有多个,而又可以利用触发器的特性。
4.lob数据处理可以获得与其它数据同样的事物特性。
5.lob的存储比较特殊,它并不是跟其他数据存储在同一个数据库表中,而是可以单独存放于不同的表空间中,由一个定位符指向实际的lob数据。
[nextpage]
三.多媒体大对象存取例程举例
按照如下步骤来完成各个操作:
(1)先建立一个数据库表:
create table lobdemo(key number key,clob_col clob,blob_col blob,bifle_col bfile);
这个数据库第一列存储一个码,另外三列存储lob型数据。
(2)表建好以后,往表中插入一条数据:
insert into lobdemo(key,clob_col,blob_col,bfile_col) values (10,'abcdefghijklmnopqrsatuvwxyzasdffasfsdafsdafsdfadfsadfsdfsdfdsdsffds',empty_blob(),null);
在这一条数据中,第二列我们插入一个字符串,它被格式化为clob类型数据进行存储;第二列我们使用empty_blob()函数来初始化一个定位符,以后就可以获取这个定位符进行比如select,update等操作了;第三列赋空值,它并没有获得一个定位符,这是与empty_blob()函数的区别。
(3)查询插入表中的数据
select blob_col from boldemo where key=20;
注意:这一sql语句的返回结果是一个定位符(locator),而不是实际的数据本身。
(4)修改数据库中数据
update lobdemo set blob_col='aedevbagddgagdfdfasasdfdsa' where key=10;
从这些sql语句当中,我们看到了lob型数据处理的基本方法,发现与其他类型数据处理相似。但是sql语句中lob型数据处理的特殊性在于以下方面:
(1)bfile文件的处理:
bfile类型有着特殊性,跟clob,blob不同。实际的数据文件存储在操作系统的外面:所以有两个特点:1.没有事务性控制 2.bfile是只读的,不能用dbms_lob或oracl8 oci进行修改。让我们来看对bfile的操作步骤:
<1> 为了访问外部文件,服务器需要知道文件在操作系统中的位置。下面我们建立一个目录:
create directory utils as '/home/utils';
utils表示目录逻辑名,'/home/utils'是实际目录。
<2>使用bfilename函数插入一行数据:
insert into lobdemo(key,bfile_col) values (-1,biflename('utils','file1'));
bfilename函数的第一个参数是逻辑目录名,第二个参数是文件名。注意:这一行中插入的是一个指向/home/utils/file1的lob定位符,并不是文件本身。
(2)利用dbms_lob包进行lob数据操作
sql仅可以操纵整个lob,而不能操纵数据片。dbms_lob包则放开了这个限制,它提供对lob数据中数据片的操作。这个包中包含十几个例程,读者可以查阅oracle pl/sql手册,本文只介绍三个函数:fileopen()用来打开一个操作系统文件;loadfromfile()例程用来往目标lob字段填充一个操作系统文件,这个函数很有实用价值,因为有许多lob内容在sql语句中是不可描述的,例如一个二进制音频文件,而用这个函数可以将文件内容导入到数据库;getlength函数计算文件的长度。请看下面一个存储过程中这三个函数的使用:
create or replace procedure fileexec(
p_directory in varchar2,
p_filename in varchar2
) as
v_filelocator bfile;
v_cloblocator clob;
begin
--为update初始化一个定位符
select clob_col
into v_cloblocator
from lobdemo
where key=-1
for update;
--为读文件初始化一个bfile定位符
v正在看的oracle教程是:oracle数据库处理多媒体信息。_filelocator:=bfileopen(p_derectory,p_filename);
--用dbms_lob包的fileopen打开一个操作系统文件
dbms_lob.fileopen(v_filelocator,dbms_lob.file_readonly);
--将整个操作系统文件装入lob中
dbms_lob.loadfromfile(v_cloblocator,v_filelocator,dbms_lob.getlength(v_filelocator));
end fileexec;
四.oracle intermedia工具介绍
intermedia是oracle推出的对oracle8i多媒体功能进行扩充的一个集成部件,它使得oracle能够更方便的管理图象、音频、视频、文本等信息。使得oracle在internet,电子商务等领域多媒体数据的管理上可靠性与可用性增强。它包括image, audio, video三部份。intermedia使用对象类型,类似于java或c++,来描述image, audio, video类型数据,oracle在这三类对象类型中定义了许多方法来操作这些数据,如对于 image类型数据来说,你可以很方便地进行图形格式转换,压缩,拷贝,截取图形的任何一部份等,而这些是普通lob类型数据所无法比拟的,普通sql语句也无法完成这些操作。
internet的发展更突出了intermedia在web应用中的价值,现有的web应用绝大多数将image,audio,video等多媒体信息存在文件系统中,其优点是操作简单,速度快,缺点是管理复杂,尤其是管理大量image时就受到目录数等的限制。如果将image保存在数据库中,由数据库来统一维护,统一备份,这样就可以简化管理。
intermedia中定义了几个多媒体对象类型,例如ordaudio就是其中一个,它提供一些audio对象类型数据的操纵函数。下面我们来看一个例子,在这个例子中我们定义一个歌曲对象,建立一个歌曲对象的表,并对该表进行插入与查询操作。
(1)定义一个歌曲对象:
create type songobject as object (
songid varchar2(20), --歌曲号
title varchar2(4000), --题目
artist varchar2(4000), --作家
awards varchar2(4000), --奖项
timeperiod varchar2(20), --日期时间
txtinroduction clob, --简介
audiosource ordsys.ordaudio --音频数据,这个字段由ordaudio对象来定义。
);
(2)建立一个名为songtable的表:
create table songstable of songobject (unique (songid), songid not null);
(3)插入一行数据到songstable表中
insert into songstable values ('00',
'under pressure',
'queen',
'no awards',
'80-90',
243,
null,
empty_clob(),
ordsys.ordaudio(null,
ordsys.ordsource(empty_blob(),null,null,null,null,null),
null, null, empty_clob(), null, null, null, null, null, null));
注意:。empty_clob,empty_blob()函数只是初始化一个lob数据定位符,而没有存储实际的数据。
(4)向songstable表中载入一行数据:
declare
audioobj ordsys.ordaudio;
ctx raw(4000) := null;
begin
--取得audiosource字段定位符
select s.audiosource into audioobj
from songstable s
where s.songid = '00'
for update;
--下面的四个函数是ordaudio对象的成员函数,具体功能请查看oracle开发手册
audioobj.setsource('file', 'auddir', 'underpressure.au');--设定文件
audioobj.setmimetype('audio/basic'); --设定类型
audioobj.import(ctx); --载入ctx
audioobj.setproperties(ctx); --设置属性
--将歌曲对象载入到数据库表中
update songstable s
set s.audiosource = audioobj
where s.songid = '00';
commit;
end;
[nextpage]
五.多媒体数据库技术难点与展望
可以说,多媒体数据的高效管理是it技术发展的必然要求,随着多媒体信息需求的进一步加强,多媒体数据库技术将会有更大的发展,从oracle数据库中我们可以看出,无论在数据类型,数据管理,还是开发管理工具上,现在的主流关系数据库已经具有很强的多媒体信息管理能力。但是我们不能不遗憾的看到,对一些多媒体数据所特有的操作(比如对多媒体信息的查询)能力还是很有限的。
一个问题就是多媒体数据的特殊操作实现,因为lob型数据是二进制的大对象,他不能简单的按照一般数据的操作符来进行计算。比如,要查出一个数据表中与某首歌相似的音频。那么对于这个'相似'操作来说,它得不到传统的操作符的支持,而且它将涉及很复杂的算法。可喜的是,oracle9i intermedia已经具有多媒体数据的查询与匹配功能,例如,可以从质地(texture),形状,颜色,颜色分量等要素进行相似图象的查询,在查询时可以设置各个要素的权值,测试的结果还是差强人意的。但是对audio,video等类型数据的查询仍然不够理想。
另外,如何描述多媒体信息,怎样根据你对多媒体信息的描述来检索,也是一个难点问题,比如这个查询任务:查询出颜色比较暗的并且有森林的风景照片,这就是根据描述性信息进行查询的例子。这将需要某种行业标准和技术实现。总之,如何实现和优化针对多媒体数据的特殊操作(如相似查询等),将是以后多媒体数据库研究和应用中的热点问题。
另外一个重要的问题就是针对多媒体数据库的性能调优,原先的调优方法如索引优化等仍然适用,但是现在遇到了新的问题:多媒体数据是庞大的,那么对多媒体信息的操作(尤其是检索)开销巨大,那么如何降低这种开销,缩短操作时间,又是一个重要课题。
上一页