C语言之常用字符串函数总结、使用和模拟实现
文章目录
目录
一、strlen 的使用和模拟实现
二、strcpy 的使用及模拟实现
三、strcat 的使用和模拟实现
四、strcmp 的使用和模拟实现
五、strncpy 的使用和模拟实现
六、strncat 的使用和模拟实现
七、strncmp 的使用和模拟实现
八、strstr 的使用和模拟实现
九、strtok函数的使用
十、strerror 函数的使用
2.补充:perror 函数的使用
前言
本文介绍和模拟实现的字符串函数有:strlen、strcpy、strcat、strcmp、strncpy、strncat、strncmp、strstr。另外详细介绍了 strtok 、strerror、perror函数的使用。基本囊括了所有常用的字符串函数。模拟实现有助于我们理解和记忆这些库函数,我们都能够自己实现这些库函数,使用时需要注意的细节我们肯定也更加清楚和深刻。最后,希望本文的内容能够帮助到大家更好的理解这些库函数
注意:字符串函数包含的头文件都为
一、strlen 的使用和模拟实现
1.使用:
功能:strlen 函数,其功能相信大家很熟悉了,就是计算字符串的长度
函数声明:size_t strlen ( const char * str );
用法:传入字符串首字符的地址,计算出的结果将以 size_t 类型返回
(size_t 是一种无符号整形,是为了代码的可移植性而定义的一种自定义类型,使用 %zd 打印)
使用演示:
#include #include int main() { char ch1[] = { "abcdefg" }; char* ch2 = "qwertyuiop"; printf("%zd\n", strlen(ch1)); printf("%zd\n", strlen(ch2)); return 0; }
运行结果:
解疑:上述ch1是数组名,表示数组首元素地址,ch2是字符指针,指向的是一个字符串字面量的首字符地址
2.模拟实现:
想要模拟实现 strlen ,我们就应该了解其机制,strlen 就是通过寻找字符串结尾处的 '\0' 字符来计算字符串的长度的,像我们平时写在双引号中的字符串,其末尾自动包含了一个'\0',我们也可以在定义字符数组的时候在其末尾手动添加 '\0',只有包含了 '\0'的字符串才能被strlen正确的计算长度
以下演示三种 strlen 的模拟实现
(以下所以代码中包含了 assert 函数,其为断言,用来检查指针是否为空,详细请移步主页指针基础知识,其中有详细讲解)
1:边寻找 '\0' 边统计字符
#include #include size_t my_strlen(const char* str) { assert(str != NULL); size_t count = 0; while (*str) { str++; count++; } return count; }
2:通过指针相减算出元素个数
#include #include size_t my_strlen(const char* str) { const char* str1 = str; assert(str != NULL); while (*str1) { str1++; } return str1 - str; }
3:使用递归实现
size_t my_strlen(const char* str) { assert(str != NULL); if (*str == '\0') { return 0; } else { return 1 + my_strlen(str + 1); } }
二、strcpy 的使用及模拟实现
1.使用:
功能:将源字符串拷贝到目标字符串之中,返回目标字符串首地址
函数声明:char * strcpy ( char * destination, const char * source );
用法:按顺序先传入目标字符串,再传入源字符串,最后 strcpy 返回的目标字符串首地址,另外,函数有以下几个要求和细节:
- 源字符串必须以 '\0' 结束。
- 会将源字符串中的 '\0' 拷贝到目标空间。
- 目标空间必须足够⼤,以确保能存放源字符串。
- 目标空间必须可修改。因此目标字符串参数没有使用const修饰
使用演示:
#include #include int main() { char ch1[20] = { "xxxxxxxxxxxxx" }; char* ch2 = "abcdefg"; char* ret = strcpy(ch1, ch2); printf("%s\n", ch1); printf("%s\n", ret); return 0; }
运行结果
解疑:值得注意的是,ch2中的'\0'也会被拷贝到ch1中我们可以通过调试观察到
另外,目标字符串小于原字符串将导致报错
2.模拟实现:
#include #include char* my_strcpy(char* dest, const char* src) { assert(dest && src); char* ret = dest; while (*dest++ = *src++) { ; } return ret; }
解疑:这里面比较难理解的估计就是这个while循环,*dest++ = *src++,首先 ++ 的优先级高于 *,因此先执行++,但因为是后置++,先使用后++,因此会先解引用,将src的值赋给dest,然后++,两字符串地址向后走一个字节长度,来到下一个字符的地址,依次循环下去,最后 src 解引用遇到'\0'赋值给dest后,整个表达式值为0,循环停止,注意循环体为空语句。最后包括'\0'在内的所有字符都从src中拷贝到了dest中,最后的最后返回目标字符串首地址
三、strcat 的使用和模拟实现
1.使用:
功能:将源字符串追加到目标字符串的末尾
函数声明:char * strcat ( char * destination, const char * source );
用法:先传入目标字符串首地址,再传入源字符串首地址,追加后返回目标字符串首地址
有以下需要注意的细节和要求:
- 源字符串必须以 '\0' 结束。
- 目标字符串中也得有 '\0' ,否则没办法知道追加从哪里开始。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
使用演示:
#include #include int main() { char ch1[20] = { "abcdef" }; char ch2[] = { "qwerty" }; char* ret = strcat(ch1, ch2); printf("%s\n", ch1); printf("%s\n", ret); return 0; }
2.模拟实现:
2.模拟实现:
#include #include char* my_strcat(char* dest, const char* src) { assert(dest && src); char* ret = dest; while (*dest) { dest++; } while (*dest++ = *src++) { ; } return ret; }
解疑:第一个while循环用来定位 dest 中'\0'位置,也就是dest中第一次出现'\0'的位置,第二个循环与前面 strcpy 一样,将源字符串src内容拷贝到目标字符串dest中,只不过是接在dest第一个'\0'的位置处,最后返回目标字符串首地址
另外考虑一个问题,问:strcat 能不能给自己追加自己?
我们使用自己模拟的strcat试一试:
结果是不可以,因为 src 追加后,使得自己变长,永远到不了'\0',结果就会导致死循环
官方的库函数却可以,但其返回值也不可以,底层逻辑的实现不同,这里不再深究
四、strcmp 的使用和模拟实现
1.使用:
功能:比较两字符串大小,不是比较长度,而是按顺序比较每一位对应字符的ASCII码值
函数声明:int strcmp ( const char * str1, const char * str2 );
用法:分别传入需要比较的字符串首地址,strcmp 会比较两字符串的对应位字符的ASCII码值,其返回值分为三种:
- 返回值 >0,表示 str1 中某一位字符大于 str2 对应位的字符
- 返回值 0)
{
*dest = 0;
dest++;
count--;
}
return ret;
}
解疑:以上的实现是我个人的想法,不是最优解。首先除了保存目标字符串首地址,计算了源字符串大小,并保存了num与源字符串长度的差值,第一个while循环,在保证拷贝没有超过 num 个字符和原字符串没有走到结尾的情况下,拷贝了能拷贝的字符。然后下面一个while循环用来判断 num是否大于源字符串长度,如果大于,则在目标字符串末尾补0。直至刚好拷贝完num个字符,最后返回目标字符串首地址。
六、strncat 的使用和模拟实现
1.使用:
功能:将源字符串的前num个字符追加到目标字符串指向的字符串末尾,再追加⼀个'\0'字符
函数声明:char * strncat ( char * destination, const char * source, size_t num );
用法:前两个参数与strcat一致,也是后面多了一个num,用来指定追加多少个字符。这里需要注意的有以下几条:
- 如果 source 指向的字符串的长度小于num的时候,只会将字符串中到 '\0' 的内容追加到destination指向的字符串末尾。大于num的话,就是源字符串的前num个字符追加到目标字符串指向的字符串末尾,再追加⼀个'\0'字符
- 目标字符串的容量得足够大,能容下追加的字符
使用演示:
#include #include int main() { char ch1[20] = { "abcd\0xxxxxxxx" }; char* ch2 = "qwerty"; char* ret = strncat(ch1, ch2, 8); printf("%s\n", ch1); printf("%s\n", ret); return 0; }
运行结果:
监视窗口:
解疑:以上代码就符合num大于源字符串长度的情况,即 source 指向的字符串的长度小于num的时候,只会将字符串中到 '\0' 的内容追加到destination指向的字符串末尾。为了方便观察,我在ch1中插入了'\0'和xxxxxxxx,最后发现末尾确实追加了一个'\0'字符。
2.模拟实现:
#include #include char* my_strncat(char* dest, const char* src, size_t num) { assert(dest && src); char* ret = dest; while (*dest) { dest++; } while (num && *src) { *dest = *src; dest++; src++; num--; } *dest = '\0'; return ret; }
解疑:前面步骤与strcat一致,到了第二个while循环,也是在保证没有追加超过num个字符和源字符串地址没有走到字符串末尾的情况下,追加所有能追加的字符,然后无论 num 大于或者小于 源字符串长度,只需要追加一个'\0'即可。最后返回目标字符串首地址。
七、strncmp 的使用和模拟实现
1.使用:
函数声明:int strncmp ( const char * str1, const char * str2, size_t num );
功能及用法:比较str1和str2的前num个字符,如果相等就继续往后比较,最多比较num个字母,如果提前发现不一样,就提前结束,大的字符所在的字符串大于另外⼀个。如果num个字符都相等,就是相等返回0。返回值情况与strcmp一致
使用演示:
#include #include int main() { char* ch1 = "abcde"; char* ch2 = "abcqwer"; int ret1 = strncmp(ch1, ch2, 3); int ret2 = strncmp(ch1, ch2, 5); printf("%d\n", ret1); printf("%d\n", ret2); return 0; }
运行结果:
解疑:基本和strcmp一样,只是多了指定比较的个数
2.模拟实现:
#include #include int my_strncmp(const char* str1, const char* str2, size_t num) { assert(str1 && str2); while ((*str1 == *str2) && num) { if (*str1 == '\0') { return 0; } str1++; str2++; num--; } if (*str1 == *str2) { return 0; } else if (*str1 > *str2) { return 1; } else { return -1; } }
解疑:模拟过程与strcmp相比,while循环多了一个num的判断,最后的条件判断也多了一条判断相等的情况,因为while循环的终止可能是由于num等于0的情况,此时需要再对字符串进行一次比较。
八、strstr 的使用和模拟实现
1.使用:
功能:在一个字符串中寻找与另一个字符串完全相同的片段
函数声明:char * strstr ( const char * str1, const char * str2 );
用法:传入两个字符串的首地址,函数返回字符串str2在字符串str1中第一次出现的位置的地址,如果找不到,就返回空指针(NULL)。
使用演示
#include #include int main() { char ch1[] = "This is a simple string"; char ch2[] = "simple"; char* ret = strstr(ch1, ch2); printf("%s\n", ret); return 0; }
运行结果:
解疑:因为函数返回的是str2字符串内容在str1中第一次出现时的地址,所以我们以%s打印时,会从这个地址一直打印到str1字符串末尾遇到'\0'停止
2.模拟实现:
#include #include #include char* my_strstr(const char* str1, const char* str2) { assert(str1 && str2); const char* s1 = NULL; const char* s2 = NULL; const char* cur = str1; if (*str2 == '\0') { return (char*)str1; } while (*cur) { s1 = cur; s2 = str2; while (*s1 && *s2 && *s1 == *s2) { s1++; s2++; } if (*s2 == '\0') { return (char*)cur; } if (strlen(cur+1)
解疑:
- 首先创建了三个指针变量,s1,s1分别用来记录str1和str2比较过程中的地址,cur记录的是str1当前位置的地址,因为途中的比较过程会打乱str1指针的指向,因此需要cur来记录str1当前位置的地址,以便s1在比较过程中没有找到相同字符串时,可以通过cur找回起始位置。而str2本身指向是不会变的,因此不需要另外的指针进行记录当前位置。
- if (*str2 == '\0') ,这个意思是如果str2是个空字符串的话,直接返回str1的地址,这是C语言标准中strstr的规定。并且空字符串本身也不需要寻找,任何字符串都包含空字符串
- while (*cur) ,这个循环条件就是cur没有指向字符串末尾。然后给s1赋值为cur,s2赋值为str2,。s1,s2就是用来比较判断两字符串是否有相同的指针。
- while (*s1 && *s2 && *s1 == *s2),这个循环意思是,只要s1,s2没有指向字符串末尾并且它两指向的字符相等,就让s1,s2一直往后走,只要有其中一个条件不满足时,循环就终止
- 循环终止后就进行一个判断,if (*s2 == '\0'),该判断的意思是,如果s2等于'\0',表示前一个循环是因为s2走到字符串末尾而终止的,s2能走到末尾,就表示s2前面的字符与s1都相同,这就表明能在str1中找到str1,此时只需要终止函数,返回cur,也就是str1当前的地址就行
- 而如果s1指向的字符不为'\0',就表示前一个循环的终止是因为s1,s2指向的字符不相同导致的,就再进行一个判断,if (strlen(cur+1)
- 如果两个判断都不满足,就让str1当前的位置往后走一步,也就是cur++,再进行循环判断。
- 如果直到最后cur都指向'\0'了,就直接返回空指针。
九、strtok函数的使用
功能:将一个字符串以指定字符的格式分隔
函数声明:char * strtok ( char * str, const char * sep );
用法:第一个参数指向了一个字符串,第二个参数指向了需要分隔的字符的集合,并且有以下要求和细节:
- 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。简单来说就是str中可能有sep包含的字符
- sep参数指向一个字符串,定义了用作分隔符的字符集合
- strtok函数找到str中的下一个标记字符(sep),并将其用 '\0' 结尾,返回一个指向这个标记的指针。(注: strtok函数会改变被操作的字符串,所以被strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
- 第一次调用,strtok函数的第⼀个参数不为 NULL ,函数将找到str中第一个标记字符,strtok函数将保存它在字符串中的位置
- 下一次调用,strtok函数的第一个参数为 NULL ,函数将在同一个字符串中被保存的位置开始,查找下一个标记
- 简单来说就是 strtok 具有保存记忆的功能,如果第一个参数传入NULL,strtok能记起同一个字符串上一次被分隔的位置
- 如果字符串中不存在更多的标记,则返回 NULL 指针。
使用演示:
#include #include int main() { char ch1[] = "abcd.bbc/123@xp"; char ch2[] = "./@"; printf("第一次分割:\n"); char* ret = strtok(ch1, ch2); printf("%s\n", ret); printf("%s\n", ch1); printf("第二次分割:\n"); ret = strtok(NULL, ch2); printf("%s\n", ret); printf("%s\n", ch1); printf("第三次分割:\n"); ret = strtok(NULL, ch2); printf("%s\n", ret); printf("%s\n", ch1); printf("第四次分割:\n"); ret = strtok(NULL, ch2); printf("%s\n", ret); printf("%s\n", ch1); printf("第五次分割:\n"); ret = strtok(NULL, ch2); printf("%s\n", ret); printf("%s\n", ch1); return 0; }
运行结果:
解疑:第一次分割将字符'.'修改为'\0',返回了起始地址,也就是字符'a'的地址,因为改变了源字符串的数据,所以此后以%s打印ch1只能打印abcd。第二次分割将字符'/'修改为'\0',然后返回了第二段起始地址,也就是字符'b'的地址。后面的结果依次类推就行。直到最后没有可分割字符返回空指针
是不是发现上面有大量重复的代码,其实我们可以使用循环来进行打印:
#include #include int main() { char str[] = "123.4545.446.xpashisdid@qq.com"; char* sep = ".@"; for (char* ret = strtok(str, sep); ret != NULL; ret = strtok(NULL, sep)) { printf("%s\n", ret); } return 0; }
运行结果:
解疑:以上for循环使用地非常巧妙,首先初始化部分调用一次strtok,传入需分割的字符串和分割字符。创建一个ret接收strtok的返回值,因为for循环初始化部分只会进行一次。所以该部分不会重复进行,然后判断部分写 ret != NULL,只要返回值不为空指针,循环就不终止。for调整部分写再一次调用strtok,传入空指针即可。strtok具有记忆保存的属性。如此一来就实现了循环分割打印的效果
十、strerror 函数的使用
1.使用:
功能:接收并记录程序运行时的错误码,返回错误码对应的错误信息的字符串地址
函数声明:char * strerror ( int errnum );
功能介绍:在不同的系统和C语言标准库的实现中都规定了一些错误码,一般是放在 errno.h 这个头文件中说明的,C语言程序启动的时候就会使用一个全局的变量errno来记录程序的当前错误码,只不过程序启动的时候errno是0,表示没有错误,当我们在使用标准库中的函数的时候发生了某种错误,就会将对应的错误码,存放在errno中,而一个错误码的数字是整数很难理解是什么意思,所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。
打印0~10错误码对应的信息:
#include #include #include int main() { int i = 0; for (i = 0; i