欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

MySQL的字符串函数使用说明

程序员文章站 2023-12-20 22:37:58
通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要 条件是:长度相等,并且各个对应位置上...
通常以串的整体作为操作对象,如:在串中查找某个子串、求取一个子串、在串的某个位置上插入一个子串以及删除一个子串等。两个字符串相等的充要 条件是:长度相等,并且各个对应位置上的字符都相等。设p、q是两个串,求q在p中首次出现的位置的运算叫做模式匹配。串的两种最基本的存储方式是顺序存 储方式和链接存储方式。
下面我们来看看mysql中的字符串函数
假如结果的长度大于 max_allowed_packet 系统变量的最大值时,字符串值函数的返回值为null。
对于在字符串位置操作的函数,第一个位置的编号为 1。
◆ ascii(str)
返回值为字符串str 的最左字符的数值。假如str为空字符串,则返回值为 0 。假如str 为null,则返回值为 null。 ascii()用于带有从 0到255的数值的字符。
mysql> select ascii(‘2′);
-> 50
mysql> select ascii(2);
-> 50
mysql> select ascii(‘dx');
-> 100
见 ord()函数。
◆ bin(n)
返回值为n的二进制值的字符串表示,其中 n 为一个longlong (bigint) 数字。这等同于 conv(n,10,2)。假如n 为null,则返回值为 null。
mysql> select bin(12);-> ‘1100′
◆ bit_length(str)
返回值为二进制的字符串str 长度。
mysql> select bit_length(‘text');-> 32
◆ char(n,… [using charset])
char()将每个参数n理解为一个整数,其返回值为一个包含这些整数的代码值所给出的字符的字符串。null值被省略。
mysql> select char(77,121,83,81,'76′);-> ‘mysql'mysql> select char(77,77.3,'77.3′);-> ‘mmm'
大于 255的char()参数被转换为多结果字符。 例如,char(256) 相当于 char(1,0), 而char(256*256) 则相当于 char(1,0,0):
mysql> select hex(char(1,0)), hex(char(256));+—————-+—————-+| hex(char(1,0)) | hex(char(256)) |+—————-+—————-+| 0100 | 0100 |+—————-+—————-+mysql> select hex(char(1,0,0)), hex(char(256*256));+——————+——————–+| hex(char(1,0,0)) | hex(char(256*256)) |+——————+——————–+| 010000 | 010000 |+——————+——————–+
char()的返回值为一个二进制字符串。可选择使用using语句产生一个给出的字符集中的字符串:
mysql> select charset(char(0×65)), charset(char(0×65 using utf8));mysql> select charset(char(0×65)), charset(char(0×65 using utf8));+———————+——————————–+| charset(char(0×65)) | charset(char(0×65 using utf8)) |+———————+——————————–+| binary | utf8 |+———————+——————————–+
如果 using已经产生,而结果字符串不符合给出的字符集,则会发出警告。同样,如果严格的sql模式被激活,则char()的结果会成为 null。
◆ char_length(str)
返回值为字符串str 的长度,长度的单位为字符。一个多字节字符算作一个单字符。对于一个包含五个二字节字符集, length()返回值为 10, 而char_length()的返回值为5。
◆ character_length(str)
character_length()是char_length()的同义词。
◆ compress(string_to_compress)
压缩一个字符串。这个函数要求 mysql已经用一个诸如zlib的压缩库压缩过。 否则,返回值始终是null。uncompress() 可将压缩过的字符串进行解压缩。
mysql> select length(compress(repeat(‘a',1000)));-> 21mysql> select length(compress(”));-> 0mysql> select length(compress(‘a'));-> 13mysql> select length(compress(repeat(‘a',16)));-> 15
压缩后的字符串的内容按照以下方式存储:
空字符串按照空字符串存储。
非空字符串未压缩字符串的四字节长度进行存储(首先为低字节),后面是压缩字符串。如果字符串以空格结尾,就会在后加一个”.”号,以防止当结 果值是存储在char或varchar类型的字段列时,出现自动把结尾空格去掉的现象。(不推荐使用 char 或varchar 来存储压缩字符串。最好使用一个 blob 列代替)。
◆ concat(str1,str2,…)
返回结果为连接参数产生的字符串。如有任何一个参数为null ,则返回值为 null。或许有一个或多个参数。 如果所有参数均为非二进制字符串,则结果为非二进制字符串。 如果自变量中含有任一二进制字符串,则结果为一个二进制字符串。一个数字参数被转化为与之相等的二进制字符串格式;若要避免这种情况,可使用显式类型 cast, 例如: select concat(cast(int_col as char), char_col)
mysql> select concat(‘my', ‘s', ‘ql');-> ‘mysql'mysql> select concat(‘my', null, ‘ql');-> nullmysql> select concat(14.3);-> ‘14.3′
◆ concat_ws(separator,str1,str2,…)
concat_ws() 代表 concat with separator ,是concat()的特殊形式。 第一个参数是其它参数的分隔符。分隔符的位置放在要连接的两个字符串之间。分隔符可以是一个字符串,也可以是其它参数。如果分隔符为 null,则结果为 null。函数会忽略任何分隔符参数后的 null 值。
mysql> select concat_ws(‘,','first name','second name','last name');-> ‘first name,second name,last name'mysql> select concat_ws(‘,','first name',null,'last name');-> ‘first name,last name'
concat_ws()不会忽略任何空字符串。 (然而会忽略所有的 null)。
◆ conv(n,from_base,to_base)
不同数基间转换数字。返回值为数字的n字符串表示,由from_base基转化为 to_base 基。如有任意一个参数为null,则返回值为 null。自变量 n 被理解为一个整数,但是可以被指定为一个整数或字符串。最小基数为 2 ,而最大基数则为 36。 if to_base 是一个负数,则 n 被看作一个带符号数。否则, n 被看作无符号数。 conv() 的运行精确度为 64比特。
mysql> select conv(‘a',16,2);-> ‘1010′mysql> select conv(‘6e',18,8);-> ‘172′mysql> select conv(-17,10,-18);-> ‘-h'mysql> select conv(10+'10′+'10′+0xa,10,10);-> ‘40′
◆ elt(n,str1,str2,str3,…)
若n = 1,则返回值为 str1 ,若n = 2,则返回值为 str2 ,以此类推。若n 小于1或大于参数的数目,则返回值为 null 。 elt() 是 field()的补数。
mysql> select elt(1, ‘ej', ‘heja', ‘hej', ‘foo');-> ‘ej'mysql> select elt(4, ‘ej', ‘heja', ‘hej', ‘foo');-> ‘foo'
◆ export_set(bits,on,off[,separator[,number_of_bits]])
返回值为一个字符串,其中对于bits值中的每个位组,可以得到一个 on 字符串,而对于每个清零比特位,可以得到一个off 字符串。bits 中的比特值按照从右到左的顺序接受检验 (由低位比特到高位比特)。字符串被分隔字符串分开(默认为逗号‘,'),按照从左到右的顺序被添加到结果中。number_of_bits 会给出被检验的二进制位数 (默认为 64)。
mysql> select export_set(5,'y','n',',',4);-> ‘y,n,y,n'mysql> select export_set(6,'1′,'0′,',',10);-> ‘0,1,1,0,0,0,0,0,0,0′
◆ field(str,str1,str2,str3,…)
返回值为str1, str2, str3,……列表中的str 指数。在找不到str 的情况下,返回值为 0 。
如果所有对于field() 的参数均为字符串,则所有参数均按照字符串进行比较。如果所有的参数均为数字,则按照数字进行比较。否则,参数按照双倍进行比较。
如果str 为null,则返回值为0 ,原因是null不能同任何值进行同等比较。field() 是elt()的补数。
mysql> select field(‘ej', ‘hej', ‘ej', ‘heja', ‘hej', ‘foo');-> 2mysql> select field(‘fo', ‘hej', ‘ej', ‘heja', ‘hej', ‘foo');-> 0
◆ find_in_set(str,strlist)
假如字符串str 在由n 子链组成的字符串列表strlist 中, 则返回值的范围在 1 到 n 之间 。一个字符串列表就是一个由一些被‘,'符号分开的自链组成的字符串。如果第一个参数是一个常数字符串,而第二个是type set列,则 find_in_set() 函数被优化,使用比特计算。如果str不在strlist 或strlist 为空字符串,则返回值为 0 。如任意一个参数为null,则返回值为 null。 这个函数在第一个参数包含一个逗号(‘,')时将无法正常运行。
mysql> select find_in_set(‘b','a,b,c,d');-> 2
◆ format(x,d)
将number x设置为格式 ‘#,###,###.##', 以四舍五入的方式保留到小数点后d位, 而返回结果为一个字符串。
◆ hex(n_or_s)
如果n_or_s 是一个数字,则返回一个 十六进制值 n 的字符串表示,在这里, n 是一个longlong (bigint)数。这相当于 conv(n,10,16)。
如果n_or_s 是一个字符串,则返回值为一个n_or_s的十六进制字符串表示, 其中每个n_or_s 里的每个字符被转化为两个十六进制数字。
mysql> select hex(255);-> ‘ff'mysql> select 0×616263;-> ‘abc'mysql> select hex(‘abc');-> 616263
◆ insert(str,pos,len,newstr)
返回字符串 str, 其子字符串起始于 pos 位置和长期被字符串 newstr取代的len 字符。 如果pos 超过字符串长度,则返回值为原始字符串。 假如len的长度大于其它字符串的长度,则从位置pos开始替换。若任何一个参数为null,则返回值为null。
mysql> select insert(‘quadratic', 3, 4, ‘what');-> ‘quwhattic'mysql> select insert(‘quadratic', -1, 4, ‘what');-> ‘quadratic'mysql> select insert(‘quadratic', 3, 100, ‘what');-> ‘quwhat'
这个函数支持多字节字元。
◆ instr(str,substr)
返回字符串 str 中子字符串的第一个出现位置。这和locate()的双参数形式相同,除非参数的顺序被颠倒。
mysql> select instr(‘foobarbar', ‘bar');-> 4mysql> select instr(‘xbar', ‘foobar');-> 0
这个函数支持多字节字元,并且只有当至少有一个参数是二进制字符串时区分大小写。
◆ lcase(str)
lcase() 是 lower()的同义词。
◆ left(str,len)
返回从字符串str 开始的len 最左字符。
mysql> select left(‘foobarbar', 5);-> ‘fooba'
◆ length(str)
返回值为字符串str 的长度,单位为字节。一个多字节字符算作多字节。这意味着 对于一个包含5个2字节字符的字符串, length() 的返回值为 10, 而 char_length()的返回值则为5。
mysql> select length(‘text');-> 4
◆ load_file(file_name)
读取文件并将这一文件按照字符串的格式返回。 文件的位置必须在服务器上,你必须为文件制定路径全名,而且你还必须拥有file 特许权。文件必须可读取,文件容量必须小于 max_allowed_packet字节。
若文件不存在,或因不满足上述条件而不能被读取, 则函数返回值为 null。
mysql> update tbl_nameset blob_column=load_file(‘/tmp/picture')where id=1;
◆ locate(substr,str) , locate(substr,str,pos)
第一个语法返回字符串 str中子字符串substr的第一个出现位置。第二个语法返回字符串 str中子字符串substr的第一个出现位置, 起始位置在pos。如若substr 不在str中,则返回值为0。
mysql> select locate(‘bar', ‘foobarbar');-> 4mysql> select locate(‘xbar', ‘foobar');-> 0mysql> select locate(‘bar', ‘foobarbar',5);-> 7
这个函数支持多字节字元,并且只有当至少有一个参数是二进制字符串时区分大小写。
◆ lower(str)
返回字符串 str 以及所有根据最新的字符集映射表变为小写字母的字符 (默认为 cp1252 latin1)。
mysql> select lower(‘quadratically');-> ‘quadratically'
这个函数支持多字节字元。
◆ lpad(str,len,padstr)
返回字符串 str, 其左边由字符串padstr 填补到len 字符长度。假如str 的长度大于len, 则返回值被缩短至 len 字符。
mysql> select lpad(‘hi',4,'??');-> ‘??hi'mysql> select lpad(‘hi',1,'??');-> ‘h'
◆ ltrim(str)
返回字符串 str ,其引导空格字符被删除。
mysql> select ltrim(‘ barbar');-> ‘barbar'
这个函数支持多字节字元。
◆ make_set(bits,str1,str2,…)
返回一个设定值 (一个包含被‘,'号分开的字字符串的字符串) ,由在bits 组中具有相应的比特的字符串组成。str1 对应比特 0, str2 对应比特1,以此类推。str1, str2, …中的 null值不会被添加到结果中。
mysql> select make_set(1,'a','b','c');-> ‘a'mysql> select make_set(1 | 4,'hello','nice','world');-> ‘hello,world'mysql> select make_set(1 | 4,'hello','nice',null,'world');-> ‘hello'mysql> select make_set(0,'a','b','c');-> ”
◆ mid(str,pos,len)
mid(str,pos,len) 是 substring(str,pos,len)的同义词。
◆ oct(n)
返回一个 n的八进制值的字符串表示,其中 n 是一个longlong (bigint)数。这等同于conv(n,10,8)。若n 为 null ,则返回值为null。
mysql> select oct(12);-> ‘14′
◆ octet_length(str)
octet_length() 是 length()的同义词。
◆ ord(str)
若字符串str 的最左字符是一个多字节字符,则返回该字符的代码, 代码的计算通过使用以下公式计算其组成字节的数值而得出:
(1st byte code)+ (2nd byte code × 256)+ (3rd byte code × 2562) …
假如最左字符不是一个多字节字符,那么 ord()和函数ascii()返回相同的值。
mysql> select ord(‘2′);-> 50
◆ position(substr in str)
position(substr in str)是 locate(substr,str)同义词。
◆ quote(str)
引证一个字符串,由此产生一个在sql语句中可用作完全转义数据值的结果。 返回的字符串由单引号标注,每例都带有单引号 (‘'')、 反斜线符号 (‘\')、 ascii nul以及前面有反斜线符号的control-z 。如果自变量的值为null, 则返回不带单引号的单词 “null”。
mysql> select quote(‘don\'t!');-> ‘don\'t!'mysql> select quote(null);-> null
◆ repeat(str,count)
返回一个由重复的字符串str 组成的字符串,字符串str的数目等于count 。若 count <= 0,则返回一个空字符串。若str 或 count 为 null,则返回 null 。
mysql> select repeat(‘mysql', 3);-> ‘mysqlmysqlmysql'
◆ replace(str,from_str,to_str)
返回字符串str 以及所有被字符串to_str替代的字符串from_str 。
mysql> select replace(‘www.mysql.com', ‘w', ‘ww');-> ‘wwwwww.mysql.com'
这个函数支持多字节字元。
◆ reverse(str)
返回字符串 str ,顺序和字符顺序相反。
mysql> select reverse(‘abc');-> ‘cba'
这个函数支持多字节字元。
◆ right(str,len)
从字符串str 开始,返回最右len 字符。
mysql> select right(‘foobarbar', 4);-> ‘rbar'
这个函数支持多字节字元。
◆ rpad(str,len,padstr)
返回字符串str, 其右边被字符串 padstr填补至len 字符长度。假如字符串str 的长度大于 len,则返回值被缩短到与 len 字符相同长度。
mysql> select rpad(‘hi',5,'?');-> ‘hi???'mysql> select rpad(‘hi',1,'?');-> ‘h'
这个函数支持多字节字元。
◆ rtrim(str)
返回字符串 str ,结尾空格字符被删去。
mysql> select rtrim(‘barbar ‘);-> ‘barbar'
这个函数支持多字节字元。
◆ soundex(str)
从str返回一个soundex字符串。 两个具有几乎同样探测的字符串应该具有同样的 soundex 字符串。一个标准的soundex 字符串的长度为4个字符,然而soundex() 函数会返回一个人以长度的字符串。 可使用结果中的substring() 来得到一个标准 soundex 字符串。在str中,会忽略所有未按照字母顺序排列的字符。 所有不在a-z范围之内的国际字母符号被视为元音字母。
mysql> select soundex(‘hello');-> ‘h400′mysql> select soundex(‘quadratically');-> ‘q36324′
注意:这个函数执行原始的soundex算法,而非更加流行的加强版本(如d. knuth所述)。其区别在于原始版本首先会删去元音,其次是重复,而加强版则首先删去重复,而后删去元音。
◆ expr1 sounds like expr2
这相当于soundex(expr1) = soundex(expr2)。
◆ space(n)
返回一个由n 间隔符号组成的字符串。
mysql> select space(6);-> ‘ ‘
◆ substring(str,pos) , substring(str from pos) substring(str,pos,len) , substring(str from pos for len)
不带有len 参数的格式从字符串str返回一个子字符串,起始于位置 pos。带有len参数的格式从字符串str返回一个长度同len字符相同的子字符串,起始于位置 pos。 使用 from的格式为标准 sql 语法。也可能对pos使用一个负值。假若这样,则子字符串的位置起始于字符串结尾的pos 字符,而不是字符串的开头位置。在以下格式的函数中可以对pos 使用一个负值。
mysql> select substring(‘quadratically',5);-> ‘ratically'mysql> select substring(‘foobarbar' from 4);-> ‘barbar'mysql> select substring(‘quadratically',5,6);-> ‘ratica' mysql> select substring(‘sakila', -3);-> ‘ila' mysql> select substring(‘sakila', -5, 3);-> ‘aki'mysql> select substring(‘sakila' from -4 for 2);-> ‘ki'
这个函数支持多字节字元。
注意,如果对len使用的是一个小于1的值,则结果始终为空字符串。
substr()是 substring()的同义词。
◆ substring_index(str,delim,count)
在定界符 delim 以及count 出现前,从字符串str返回自字符串。若count为正值,则返回最终定界符(从左边开始)左边的一切内容。若count为负值,则返回定界符(从右边开始)右边的一切内容。
mysql> select substring_index(‘www.mysql.com', ‘.', 2);-> ‘www.mysql'mysql> select substring_index(‘www.mysql.com', ‘.', -2);-> ‘mysql.com'
这个函数支持多字节字元。
◆ trim([{both | leading | trailing} [remstr] from] str) trim(remstr from] str)
返回字符串 str , 其中所有remstr 前缀和/或后缀都已被删除。若分类符both、leadin或trailing中没有一个是给定的,则假设为both 。 remstr 为可选项,在未指定情况下,可删除空格。
mysql> select trim(‘ bar ‘);-> ‘bar'mysql> select trim(leading ‘x' from ‘xxxbarxxx');-> ‘barxxx'mysql> select trim(both ‘x' from ‘xxxbarxxx');-> ‘bar'mysql> select trim(trailing ‘xyz' from ‘barxxyz');-> ‘barx'
这个函数支持多字节字元。
◆ ucase(str)
ucase()是upper()的同义词。
◆ uncompress(string_to_uncompress)
对经compress()函数压缩后的字符串进行解压缩。若参数为压缩值,则结果为 null。这个函数要求 mysql 已被诸如zlib 之类的压缩库编译过。否则, 返回值将始终是 null。
mysql> select uncompress(compress(‘any string'));-> ‘any string'mysql> select uncompress(‘any string');-> null
◆ uncompressed_length(compressed_string)
返回压缩字符串压缩前的长度。
mysql> select uncompressed_length(compress(repeat(‘a',30)));-> 30
◆ unhex(str)
执行从hex(str)的反向操作。就是说,它将参数中的每一对十六进制数字理解为一个数字,并将其转化为该数字代表的字符。结果字符以二进制字符串的形式返回。
mysql> select unhex(‘4d7953514c');-> ‘mysql'mysql> select 0×4d7953514c;-> ‘mysql'mysql> select unhex(hex('string'));-> 'string'mysql> select hex(unhex(‘1267′));-> ‘1267′
◆ upper(str)
返回字符串str, 以及根据最新字符集映射转化为大写字母的字符 (默认为cp1252 latin1).
mysql> select upper(‘hej');-> ‘hej'
该函数支持多字节字元。

ascii(str)返回字符串str的最左面字符的ascii代码值。如果str是空字符串,返回0。如果str是null,返回null。
也可参见ord()函数。
ord(str)如果字符串str最左面字符是一个多字节字符,通过以格式((first byte ascii code)*256+(second byte ascii code))[*256+third byte ascii code...]返回字符的ascii代码值来返回多字节字符代码。如果最左面的字符不是一个多字节字符。返回与ascii()函数返回的相同值。

conv(n,from_base,to_base)在不同的数字基之间变换数字。
比如:conv(15,10,2)
结果:1111
bin(n)返回数n的二进制形式,n是一个长整数(bigint)数字,这等价于conv(n,10,2)。如果n是null,返回null。
比如:bin(15)
结果:1111
oct(n)返回数n的八进制形式,在此n是一个长整型数字,这等价于conv(n,10,8)。如果n是null,返回null。
比如:oct(15)
结果:17
hex(n)返回数n的十六进制,在此n是一个长整型(bigint)数字,这等价于conv(n,10,16)。如果n是null,返回null。
比如:hex(15)
结果:f
char(n,...)char()将参数解释为整数并且返回由这些整数的ascii代码字符组成的一个字符串。null值被跳过。
比如:char(97,98,99)
结果:abc
concat(str1,str2,...)返回来自于参数连结的字符串。如果任何参数是null,返回null。可以有超过2个的参数。一个数字参数被变换为等价的字符串形式。
比如:concat('myname','is','marcofly')
结果:mynameismarcofly
length(str) octet_length(str) char_length(str) character_length(str)返回字符串str的长度。
比如:length('测试')
结果:6
注意,对于多字节字符,其char_length()仅计算一次。
locate(substr,str) position(substr in str)返回子串substr在字符串str第一个出现的位置,如果substr不是在str里面,返回0.
比如:locate('name','my name is whf')
结果:4
比如:position('name' in 'my name is whf')
结果:4
locate(substr,str,pos)返回子串substr在字符串str第一个出现的位置,从位置pos开始。如果substr不是在str里面,返回0。
比如:locate('name','my name is whf',2)
结果:4
这函数是多字节可靠的。
instr(str,substr)返回子串substr在字符串str中的第一个出现的位置。这与有2个参数形式的locate()相同,除了参数被颠倒。这函数是多字节可靠的。
lpad(str,len,padstr)返回字符串str,左面用字符串padstr填补直到str是len个字符长。
比如:lpad('测试',6,'1')
结果:1111测试
rpad(str,len,padstr)返回字符串str,右面用字符串padstr填补直到str是len个字符长。
比如:rpad('测试',6,'1')
结果:测试1111

left(str,len)返回字符串str的最左面len个字符。(sql注入常用来猜测字段名)
比如:left('marcofly',5) 结果:marco
该函数是多字节可靠的。
right(str,len)返回字符串str的最右面len个字符。
比如:right('marcofly',3) 结果:fly
该函数是多字节可靠的。
substring(str,pos,len) substring(str from pos for len) mid(str,pos,len)从字符串str返回一个len个字符的子串,从位置pos开始。使用from的变种形式是ansi sql92语法。
比如:substring('marcofly',6,3)
结果:fly
该函数是多字节可靠的。
substring(str,pos) substring(str from pos)从字符串str的起始位置pos返回一个子串。
比如:substring('marcofly',6)
结果:fly

上一篇:

下一篇: