String Manipulation
overview
之前的文章 strings 提到过,c 语言中的字符串就是内存中的字节序列,以 null (‘\0’) 结尾。这个 null 字符至关重要,因为它使得所有的这些字符串操作函数(比如 printf(), puts(), 以及其他所有的操作字符串的函数)知道字符串在何处结尾。
下面,我们就来讨论下这些字符串操作函数:截出子字符串、把若干字符串连接起来、获取字符串长度等等。
strlen()
返回字符串长度
prototype
#include size_t strlen(const char*s);
description
这个函数返回一个字符串的长度(不包含 null 结尾符)。它是遍历整个字符串,知道碰到 null 字符,所以有点耗时间。如果你需要重复获得相同字符串的长度,最好使用 strlen() 之后,把长度值保存在一个变量中。
return value
返回字符串中的字符个数
example
char *s = "hello, world!"; // 13 characters // prints "the string is 13 characters long.": printf("the string is %d characters long.\n", strlen(s));
strcmp(), strncmp()
比较两个字符串并且返回一个差值。
prototype
#include int strcmp(const char *s1, const char *s2); int strncmp(const char *s1, const char *s2, size_t n);
description
两个函数均是对两个字符串进行比较。strcmp() 比较整个字符串,而 strncmp() 仅仅比较字符串的前 n 个字符。
返回的差值要说明一下:
- 如果两个字符串相同,返回 0,否则
- 如果 s1 小于 s2,返回的是 负数,否则
- 返回的是正数
通常情况下,只要检查返回值是不是 0 就行了,因为人们一般只关心两个字符串是不是相同。
return value
如果两个字符串相等,返回0;如果 s1 小于 s2,返回 负数;如果 s1 大于 s2 返回正数。
example
char *s1 = "muffin"; char *s2 = "muffin sandwich"; char *s3 = "muffin"; strcmp("biscuits", "kittens"); // returns < 0 因为 'b' < 'k' strcmp("kittens", "biscuits"); // returns > 0 因为 'k' > 'b' if (strcmp(s1, s2) == 0) printf("this won't get printed because the strings differ"); if (strcmp(s1, s3) == 0) printf("this will print because s1 and s3 are the same"); if (!strcmp(s1, s3)) printf("the strings are the same!") if (!strncmp(s1, s2, 6)) printf("the first 6 characters of s1 and s2 are the same");
strcat(), strncat()
把两个字符串连成一个
prototype
#include char* strcat(const char *dest, const char *src); char* strncat(const char *dest, const char *src, size_t n);
description
“concatenate”,就是连接的意思。这俩函数把持有两个字符串,然后把它们连接起来,存储在第一个字符串中。
值得注意的是,这俩函数都没有考虑第一个字符串的长度问题。把一个 2m 的字符串存储在一个 10b 的空间里,结果一定会非常的酸爽。
一定要检查字符串的长度问题。不然会出现意想不到的结果。
strncat() 把 src 的前 n 个字符添加到 dest 的结尾处(覆盖 dest 结尾处的 ‘\0’) 并添加 ‘\0’。
return value
两个函数均返回指向 destination 字符串的指针
example
char dest[20] = "hello"; char *src = ", world!"; char numbers[] = "12345678"; printf("dest before strcat: \"%s\"\n", dest); // "hello" strcat(dest, src); printf("dest after strcat: \"%s\"\n", dest); // "hello, world!" strncat(dest, numbers, 3); // strcat first 3 chars of numbers printf("dest after strncat: \"%s\"\n", dest); // "hello, world!123"
strchr(), strrchr()
在字符串中查询字符
prototype
#include char *strchr(char *str, int c); char *strrchr(char *str, int c);
description
strchr() 和 strrchr() 在字符串中查找首次或者最后出现的一个字符( “r” 是 “reverse” 的意思,从后往前找)。每个函数都会返回指向找到的字符的指针,如果没找到,返回 null。
如果想找下一次出现的位置,那么可以再次调用函数并且参数设置成上一次的返回值加 1(正向找)。或者减 1 (反向找的话)。如果正好到了字符串的末尾了,那要小心了,不然可能会溢出。
return value
返回指向找到的字符的指针,如果没找到,返回 null。
example
// "hello, world!" // ^ ^ // a b char *str = "hello, world!"; char *p; p = strchr(str, ','); // p now points at position a p = strrchr(str, 'o'); // p now points at position b // repeatedly find all occurances of the letter 'b' char *str = "a big brown bat bit beej"; char *p; for(p = strchr(str, 'b'); p != null; p = strchr(p + 1, 'b')) { printf("found a 'b' here: %s\n", p); } // output is: // // found a 'b' here: big brown bat bit beej // found a 'b' here: brown bat bit beej // found a 'b' here: bat bit beej // found a 'b' here: bit beej // found a 'b' here: beej
strcpy(), strncpy()
拷贝一个字符串
prototype
#include char *strcpy(char *dest, char *src); char *strncpy(char *dest, char *src, size_t n);
descpription
这俩函数从一个地址处拷贝一个字符串到另一个地址,在 src 字符串的 null 处停止拷贝。
strncpy() 与 strcpy() 很像,唯一的区别就是只拷贝 src 的前 n 个字符。
请注意
如果 src 没有 n 个字符,那么 dest 字符串将不会以 null 结尾。一定要小心。这个时候 strncpy() 的表现与 strcpy() 是一样的。
可以手动给字符串添加结束字符 ‘\0’:
char s[10]; char foo = "my hovercraft is full of eels."; // more than 10 chars strncpy(s, foo, 9); // only copy 9 chars into positions 0-8 s[9] = '\0'; // position 9 gets the terminator
return value
两个函数均返回指向目标字符串 dest 的指针
example
char *src = "hockey hockey hockey hockey hockey hockey hockey hockey"; char dest[20]; int len; strcpy(dest, "i like "); // dest is now "i like " len = strlen(dest); // be aware the differences between strlen() and sizeof() strncpy(dest+len, src, sizeof(dest)-len-1); // remember that sizeof() returns the size of the array in bytes // and a char is a byte: dest[sizeof(dest)-1] = '\0'; // terminate // dest is now: v null terminator // i like hockey hocke
strspn(), strcspn()
返回字符串中第一个不在 (strspn()) 或者 在 (strcspn()) 指定字符串中出现的字符下标
prototype
#include size_t strspn(char *str, const char *accept); size_t strcspn(char *str, const char *reject);
description
strspn() 函数告诉你 src 字符串中第一个不在 accept 字符串中出现的字符的下标。
strcspn() 函数告诉你 src 字符串中第一个在 reject 字符串中出现的字符的下标
return value
返回字符串中第一个不在 (strspn()) 或者 在 (strcspn()) 指定字符串中出现的字符下标
example
char str1[] = "a banana"; char str2[] = "the bolivian navy on manuvers in the south pacific"; // str1 中第一个不在 "aeiou" 中的字符下标? n = strspn(str1, "aeiou"); // n == 1,"e" // str1 中第一个不在 "ab " 中的字符下标? n = strspn(str1, "ab "); // n == 4,"n" // str2 中第一个在 "y" 中的字符下标? n = strcspn(str2, "y"); // n = 16, "y"
strstr()
在一个字符串中查找另一个字符串
prototype
#include char *strstr(const char *str, const char *substr);
descprition
在 str 字符串中查找 substr,返回指向 substr 的指针。
return value
返回指向 substr 的指针,或者是 null(如果没找到)。
example
char *str = "the quick brown fox jumped over the lazy dogs."; char *p; p = strstr(str, "lazy"); printf("%s\n", p); // "lazy dogs." // p is null after this, since the string "wombat" isn't in str: p = strstr(str, "wombat");
strtok()
分割字符串
prototype
#include char *strtok(char *str, const char *delim);
descprition
如果有一个字符串里面有很多分隔符,想要把这个字符串分割成一小段一小段,那么这个函数就派上用场了。
strtok() 的使用方式有点特别,其实是有点怪异。
str 是将要被分割的字符串,第一次调用 strtok() 时,str 已经被分割成一个一个的小片段了。为了获得更多的分割的片段,需要多次调用 strtok(),但是需要传入 null。这是它诡异的地方,但是 strtok() 记住了初始传入的 str 字符串,然后不断的分割它。
需要注意的是,str 字符串在调用过程中会被破坏掉,所以如果想不被修改,需要传入 str 的副本,这样 strtok() 就不会破坏原始字符串了。
return value
一个指向下一个 分隔片段 的指针,如果没了,就返回 null。
example
char str[] = "where is my bacon, dude?"; char *token; // 注意,在使用 strtok() 时,下面的 if-do-while 结构 // 会经常经常经常见到!!! // 获取第一个token (making sure there is a first token!) if ((token = strtok(str, ".,?! ")) != null) { do { printf("word: \"%s\"\n", token); // while循环继续获取下一个 token // (传入 null 作为第一个参数) } while ((token = strtok(null, ".,?! ")) != null); } // output: word: "where" word: "is" word: "my" word: "bacon" word: "dude"