mysql LOAD语句批量录入数据
1、基本语法
语法:load data [local] infile 'file_name.txt' [replace | ignore] into table tbl_name load data infile语句从一个文本文件中以很高的速度读入一个表中。如果指定local关键词,从客户主机读文件。如果local没指定,文件必须位于服务器上。(local在mysql3.22.6或以后版本中可用。)
为了安全原因,当读取位于服务器上的文本文件时,文件必须处于数据库目录或可被所有人读取。另外,为了对服务器上文件使用load data infile,在服务器主机上你必须有file的权限。见第七章 数据库安全。
replace和ignore关键词控制对现有的唯一键记录的重复的处理。如果你指定replace,新行将代替有相同的唯一键值的现有行。如果你指定ignore,跳过有唯一键的现有行的重复行的输入。如果你不指定任何一个选项,当找到重复键键时,出现一个错误,并且文本文件的余下部分被忽略时。
如果你使用local关键词从一个本地文件装载数据,服务器没有办法在操作的当中停止文件的传输,因此缺省的行为好像ignore被指定一样。
2、文件的搜寻原则
当在服务器主机上寻找文件时,服务器使用下列规则:
如果给出一个绝对路径名,服务器使用该路径名。
如果给出一个有一个或多个前置部件的相对路径名,服务器相对服务器的数据目录搜索文件。
如果给出一个没有前置部件的一个文件名,服务器在当前数据库的数据库目录寻找文件。
注意这些规则意味着一个像“./myfile.txt”给出的文件是从服务器的数据目录读取,而作为“myfile.txt”给出的一个文件是从当前数据库的数据库目录下读取。也要注意,对于下列哪些语句,对db1文件从数据库目录读取,而不是db2:
mysql> use db1; mysql> load data infile "./data.txt" into table db2.my_table; |
3、fields和lines子句的语法
如果你指定一个fields子句,它的每一个子句(terminated by, [optionally] enclosed by和escaped by)也是可选的,除了你必须至少指定他们之一。
如果你不指定一个fields子句,缺省值与如果你这样写的相同:
fields terminated by '\t' enclosed by '' escaped by '\\'
如果你不指定一个lines子句,缺省值与如果你这样写的相同:
lines terminated by '\n'
换句话说,缺省值导致读取输入时,load data infile表现如下:
在换行符处寻找行边界
在定位符处将行分进字段
不要期望字段由任何引号字符封装
将由“\”开头的定位符、换行符或“\”解释是字段值的部分字面字符
load data infile能被用来读取从外部来源获得的文件。例如,以dbase格式的文件将有由逗号分隔并用双引号包围的字段。如果文件中的行由换行符终止,下面显示的命令说明你将用来装载文件的字段和行处理选项:
mysql> load data infile 'data.txt' into table tbl_name fields terminated by ',' enclosed by '"' lines terminated by '\n'; |
任何字段或行处理选项可以指定一个空字符串('')。如果不是空,fields [optionally] enclosed by和fields escaped by值必须是一个单个字符。fields terminated by和lines terminated by值可以是超过一个字符。例如,写入由回车换行符对(cr+lf)终止的行,或读取包含这样行的一个文件,指定一个lines terminated by '\r\n'子句。
fields [optionally] enclosed by控制字段的包围字符。对于输出(select ... into outfile),如果你省略optionally,所有的字段由enclosed by字符包围。对于这样的输出的一个例子(使用一个逗号作为字段分隔符)显示在下面:
"1","a string","100.20"
"2","a string containing a , comma","102.20"
"3","a string containing a \" quote","102.20"
"4","a string containing a \", quote and comma","102.20"
如果你指定optionally,enclosed by字符仅被用于包围char和varchar字段:
1,"a string",100.20
2,"a string containing a , comma",102.20
3,"a string containing a \" quote",102.20
4,"a string containing a \", quote and comma",102.20
注意,一个字段值中的enclosed by字符的出现通过用escaped by字符作为其前缀来转义。也要注意,如果你指定一个空escaped by值,可能产生不能被load data infile正确读出的输出。例如,如果转义字符为空,上面显示的输出显示如下。注意到在第四行的第二个字段包含跟随引号的一个逗号,它(错误地)好象要终止字段:
1,"a string",100.20
2,"a string containing a , comma",102.20
3,"a string containing a " quote",102.20
4,"a string containing a ", quote and comma",102.20
fields escaped by控制如何写入或读出特殊字符。如果fields escaped by字符不是空的,它被用于前缀在输出上的下列字符:
fields escaped by字符
fields [optionally] enclosed by字符
fields terminated by和lines terminated by值的第一个字符
ascii 0(实际上将后续转义字符写成 ascii'0',而不是一个零值字节)
如果fields escaped by字符是空的,没有字符被转义。指定一个空转义字符可能不是一个好主意,特别是如果在你数据中的字段值包含刚才给出的表中的任何字符。
对于输入,如果fields escaped by字符不是空的,该字符的出现被剥去并且后续字符在字面上作为字段值的一个部分。例外是一个转义的“0”或“n”(即,\0或\n,如果转义字符是“\”)。这些序列被解释为ascii 0(一个零值字节)和null。见下面关于null处理的规则。
总结
为数据库装载数据是管理员的重要职责之一,正因为重要,所以mysql提供的方法也是非常繁多。其中主要的在本节已经列举:
1、使用insert、replace语句
2、使用insert/replace…select语句
3、使用load data infile语句
4、使用实用程序mysqlimport