112.说一说strcpy、sprintf与memcpy这三个函数的不同之处

发布时间 2023-07-12 21:29:58作者: CodeMagicianT

112.说一说strcpy、sprintf与memcpy这三个函数的不同之处

1.复制的内容不同。strcpy只能复制字符串,而memcpy可以复制任意内容,例如字符数组、整型、结构体、类等。

2.复制的方法不同。strcpy不需要指定长度,它遇到被复制字符的串结束符"\0"才结束,所以容易溢出。memcpy则是根据其第3个参数决定复制的长度。

3.用途不同。通常在复制字符串时用strcpy,而需要复制其他类型数据时则一般用memcpy

1.操作对象不同

① strcpy的两个操作对象均为字符串

② sprintf的操作源对象可以是多种数据类型,目的操作对象是字符串

③ memcpy的两个对象就是两个任意可操作的内存地址,并不限于何种数据类型。

2.复制的方法不同

①strcpy不需要指定长度,它遇到被复制字符的串结束符"\0"才结束,所以容易溢出。

② sprintf如果失败,则返回一个负数。对于写入buffer(它可以指代缓存、缓冲区等)的字符数是没有限制的,这就存在了buffer溢出的可能性。

③memcpy则是根据其第3个参数决定复制的长度。

3.执行效率不同

memcpy最高,strcpy次之,sprintf的效率最低。

4.实现功能不同

① strcpy主要实现字符串变量间的拷贝

② sprintf主要实现其他数据类型格式到字符串的转化

③ memcpy主要是内存块间的拷贝。

1.memcpy

1.1原理

memcpy函数是C/C++语言中的一个用于内存复制的函数,声明在 string.h 中(C++是 cstring)。其原型是:

void *memcpy(void *destin, void *source, unsigned n);

作用是:以source指向的地址为起点,将连续的n个字节数据,复制到以destin指向的地址为起点的内存中。
函数有三个参数,第一个是目标地址,第二个是源地址,第三个是数据长度。

使用memcpy函数时,需要注意:

●数据长度(第三个参数)的单位是字节(1byte = 8bit)。

●注意该函数有一个返回值,类型是void*,是一个指向destin的指针。

void *memcpy(void *dst, const void *src, size_t size)
{
    char *psrc;
    char *pdst;

    if (NULL == dst || NULL == src)
    {
        return NULL;
    }

    if ((src < dst) && (char *)src + size > (char *)dst) // 出现地址重叠的情况,自后向前拷贝
    {
        psrc = (char *)src + size - 1;
        pdst = (char *)dst + size - 1;
        while (size--)
        {
            *pdst-- = *psrc--;
        }
    }
    else
    {
        psrc = (char *)src;
        pdst = (char *)dst;
        while (size--)
        {
            *pdst++ = *psrc++;
        }
    }

    return dst;
}

1.2memcpy函数复制的数据长度

使用memcpy函数时,特别要注意数据长度。如果复制的数据类型是char,那么数据长度就等于元素的个数。而如果数据类型是其他(如int, double, 自定义结构体等),就要特别注意数据长度的值。
好的习惯是,无论拷贝何种数据类型,都用 n * sizeof(type_name)的写法。

char a[10] = "abcdefgh";
unsigned n = 2;
void * p = memcpy(a+3, a, n);

以上代码将从a开始的两个字节的数据(即’a’和’b’),复制到从a+3开始的内存('d’所在的地址)。这样,'d’和’e’被替换。
执行结束之后,字符数组(字符串)a的内容变为"abcabfgh",返回值p即为a的地址(p == a)。

int a[10] = { 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 };
unsigned n = 5;
void * p = memcpy(a+3, a, n);

int类型的长度是4个字节。以上代码将从a开始的5个字节的数据复制。5个字节的数据是什么呢?前四个字节组成了一个完整的int(即第一个元素0)。第五个字节,只能取到第二个元素的第1个字节。这里又会涉及到big-endian和little-endian的问题。假设是小端方式储存(更常见),那么读到的是元素1的低8位,写成十六进制即0x1。
目标地址是a+3。由于指针加减常数,单位是与类型保持一致的,也就是在a的基础上,增加3倍int长度,对应的是元素3的地址。元素3被替换为0。元素4写成十六进制是0x0004,低8位被替换为0x1,变为0x0001。
所以执行结束之后,数组a的内容变为 { 0, 1, 2, 0, 1, 5, 6, 7, 8, 9 },返回值p即为a的地址(p == a)。
根据上面的解释,如果把程序里的n改为6、7、8,那么结果都是一样的。因为数字1和4的二进制表示除了低8位不同,高位都是0。

倘若高位不相同,那么结果就没那么简单了。还是以int数组为例:

int a[10] = { 0, -1, 2, 3, 4, 5, 6, 7, 8, 9 };
unsigned n = 5;
memcpy(a+3, a, n);

复制5个字节的数据,前4个字节组成了一个int,即第一个元素0。那么元素3被替换为0。第5个字节从-1中取。-1的十六进制表示为0xFFFF,第5个字节的数据是0xF。元素4变为0x000F,即15。数组a变为 { 0, -1, 2, 0, 15, 5, 6, 7, 8, 9 }。
如果 n = 6,那么4变为0x00FF,即255。数组a变为 { 0, -1, 2, 0, 255, 5, 6, 7, 8, 9 }。

可以看出,如果你想用memcpy复制元素,那么一定要写对数据长度。如果要完整地复制 n 个 int 类型元素,那么写法如下:

int a[10] = { 0, -1, 2, 3, 4, 5, 6, 7, 8, 9 };
unsigned n = 5 * sizeof(int);
memcpy(a+3, a, n);

数组a变为 { 0, -1, 2, 0, -1, 2, 0, -1, 8, 9 }。
如果是其他类型,用法也是一样的。

https://blog.csdn.net/GoodLinGL/article/details/114602721?ops_request_misc={"request_id"%3A"168887569316800227468961"%2C"scm"%3A"20140713.130102334.."}&request_id=168887569316800227468961&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2alltop_positive~default-1-114602721-null-null.142v88control,239v2insert_chatgpt&utm_term=memcpy&spm=1018.2226.3001.4187)

2.字符串函数strcpy

(1)strcpy函数

char* strcpy(char* destination, const char * source);

strcpy是覆盖拷贝,将source全覆盖拷贝到destination,会把’\0’也拷过去,且必须考虑destination的空间够不够
(destination的空间必须>=source的空间)

(2)strcpy的使用

a.代码

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<string.h>
int main()
{
	char p1[] = "abcdef";
	char* p2 = "hello";
	strcpy(p1, p2);
	printf("%s\n", p1);
	printf("%s\n", p2);
	return 0;
}

b.运行结果

hello
hello

c.错误举例

代码:

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<string.h>
int main()
{
	char p1[] = "abcdef";
	char* p2 = "hello";
	const char* p3 = "world";
	strcpy(p1, p3);//正确
	strcpy(p3, p1);//错误
	//strcpy(p2, p3);
	printf("%s\n", p1);
	printf("%s\n", p3);
	return 0;
}

错误分析:

(3)模拟实现strcpy

a.代码

#define _CRT_SECURE_NO_WARNINGS
#include<stdio.h>
#include<string.h>
void MyStrcpy(char* dst, const char* src)
{
	while (*src)
	{
		*dst = *src;
		++src;
		++dst;
	}
	*dst = '\0';
}
int main()
{
	char p1[] = "abcdef";
	const char* p2 = "hello";
	MyStrcpy(p1, p2);
	printf("%s\n", p1);
	printf("%s\n", p2);
	return 0;
}

b.运行结果

hello
hello

3.sprintf函数用法详解

1.sprintf() 函数使用

sprintf指的是字符串格式化命令,函数声明为

 int sprintf(char *string, char *format [,argument,…]);
string-- 这是指向一个字符数组的指针,该数组存储了 C 字符串。
format-- 这是字符串,包含了要被写入到字符串 str 的文本。它可以包含嵌入的 format 标签,format 标签可被随后的附加参数中指定的值替换,并按需求进行格式化。format 标签属性是%[flags][width][.precision][length]specifier
[argument]...:根据不同的 format 字符串,函数可能需要一系列的附加参数,每个参数包含了一个要被插入的值,替换了 format 参数中指定的每个 % 标签。参数的个数应与 % 标签的个数相同。

主要功能是把格式化的数据写入某个字符串中,即发送格式化输出到 string 所指向的字符串。sprintf 是个变参函数。使用sprintf 对于写入buffer(它可以指代缓存、缓冲区等)的字符数是没有限制的,这就存在了buffer溢出的可能性。解决这个问题,可以考虑使用 snprintf函数,该函数可对写入字符数做出限制。
函数声明

 int sprintf(char *string, char *format [,argument,…]);

参数列表

string-- 这是指向一个字符数组的指针,该数组存储了 C 字符串。
format-- 这是字符串,包含了要被写入到字符串 str 的文本。它可以包含嵌入的 format 标签,format 标签可被随后的附加参数中指定的值替换,并按需求进行格式化。format 标签属性是%[flags][width][.precision][length]specifier
[argument]...:根据不同的 format 字符串,函数可能需要一系列的附加参数,每个参数包含了一个要被插入的值,替换了 format 参数中指定的每个 % 标签。参数的个数应与 % 标签的个数相同。

功能:把格式化的数据写入某个字符串缓冲区。
返回值:如果成功,则返回写入的字符总数,不包括字符串追加在字符串末尾的空字符。如果失败,则返回一个负数。

sprintf 返回以format为格式argument为内容组成的结果被写入string的字节数,结束字符‘\0’不计入内。即,如果“Hello”被写入空间足够大的string后,函数sprintf 返回5。

说明1:该函数包含在stdio.h的头文件中,使用时需要加入:#include <stdio.h>

说明 2:sprintf与printf函数的区别:二者功能相似,但是 sprintf函数打印到字符串中,而printf函数打印输出到屏幕上。sprintf函数在我们完成其他数据类型转换成字符串类型的操作中应用广泛。

说明3:sprintf函数的格式

 int sprintf( char *buffer, const char *format [, argument,…] );

除了前两个参数固定外,可选参数可以是任意个。buffer是字符数组名;format是格式化字符串(像:"=%6.2f%#x%o",%与#合用时,自动在十六进制数前面加上0x)。只要在printf中可以使用的格式化字符串,在sprintf都可以使用。其中的格式化字符串是此函数的精华。
本文链接:(7条消息) sprintf函数用法详解_只爱编程的菜鸟的博客-CSDN博客

1.1用法1:格式化数字字符串

sprintf最常见的应用之一莫过于把整数打印到字符串中,所以,sprintf 在大多数场合可以替代itoa(把一个整数转换为字符串)。如:

1.把整数123打印成一个字符串保存在str中

char str[20];
double f = 14.309948;

sprintf(str, "%d", 123); // 产生"123"
cout << str << endl;

2.指定宽度,不足的左边补空格

sprintf(str, "%8d%8d", 123, 4567); // 产生:"    123    4567"

可以左对齐

sprintf(str, "%-8d%8d", 123, 4567); // 产生:"123         4567"

3.按照16进制打印

sprintf(str, "%8x", 4567); // 小写16进制,宽度占8个位置,右对齐
sprintf(str, "%-8X", 4568); // 大写16进制,宽度占8个位置,左对齐

这样,一个整数的16进制字符串就很容易得到,但我们在打印16进制内容时,通常想要一种左边补0的等宽格式,那该怎么做呢?很简单,在表示宽度的数字前面加个0就可以了。

sprintf(str, "%08X", 4567); // 产生:"000011D7"

上面以 "%d" 进行的10进制打印同样也可以使用这种左边补0的方式。

这里要注意一个符号扩展的问题:比如,假如我们想打印短整数(short)-1的内存16进制表示形式,在Win32平台上,一个 short 型占2个字节,所以我们自然希望用4位16进制数字来打印它:

short si = -1;
sprintf(str, "%04X", si);
//在C语言中,%04X表示按4位16进制输出数据,最小输出宽度为4个字符,如果输出的数据小于4个字符,前补0。例如,如果输出的数据为100,那么输出的结果为0064。

产生 "FFFFFFFF",怎么回事?因为 sprintf 是个变参函数,除了前面两个参数之外,后面的参数都不是类型安全的,函数更没有办法仅仅通过一个“%X”就能得知当初函数调用前参数压栈时被压进来的到底是个4字节的整数还是个2字节的短整数,所以采取了统一4字节的处理方式,导致参数压栈时做了符号扩展,扩展成了32位的整数-1,打印时4个位置不够了,就把32位整数-1的8位16进制都打印出来了。如果你想看si的本来面目,那么就应该让编译器做0扩展而不是符号扩展(扩展时二进制左边补0而不是补符号位):

sprintf(str, "%04X", (unsigned short)si);

或者:

unsigned short si = -1;
sprintf(str, "%04X", si);

sprintf 和 printf 还可以按8进制打印整数字符串,使用“%o”。注意8进制和16进制都不会打印出负数,都是无符号的,实际上也就是变量的内部编码的直接的16进制或8进制表示。

1.2用法2:控制浮点数打印格式

浮点数的打印和格式控制是 sprintf 的又一大常用功能,浮点数使用格式符“%f”控制,默认保留小数点后6位数字,比如:

sprintf(str, "%f", 3.1415926); // 产生 "3.141593"

但有时我们希望自己控制打印的宽度和小数位数,这时就应该使用:“%m.nf”格式,其中m表示打印的宽度,n表示小数点后的位数。比如:

sprintf(str, "%10.3f", 3.1415926);    // 产生:"     3.142″
sprintf(str, "%-10.3f", 3.1415926);   // 产生:"3.142     "
sprintf(str, "%.3f", 3.1415926);      // 不指定总宽度,产生:"3.142"

注意一个问题

int i = 100;
sprintf(str, "%.2f", i);

输出结果:

100

第二个问题

sprintf(s, "%.2f", (double)i);

输出结果:

100

第一个打出来的肯定不是正确结果,原因跟前面提到的一样,参数压栈时调用者并不知道跟i相对应的格式控制符是个“%f”。而函数执行时函数本身则并不知道当年被压入栈里的是个整数,于是可怜的保存整数i的那4个字节就被不由分说地强行作为浮点数格式来解释了,整个乱套了。

不过,如果有人有兴趣使用手工编码一个浮点数,那么倒可以使用这种方法来检验一下你手工编排的结果是否正确。

字符/Ascii码对照

我们知道,在C/C++语言中,char也是一种普通的scalable类型,除了字长之外,它与short,int,long这些类型没有本质区别,只不过被大家习惯用来表示字符和字符串而已。

(或许当年该把这个类型叫做“byte”,然后现在就可以根据实际情况,使用 byte 或 short 来把 char 通过 typedef 定义出来,这样更合适些)

于是,使用“%d”或者“%x”打印一个字符,便能得出它的10进制或16进制的ASCII码;反过来,使用“%c”打印一个整数,便可以看到它所对应的ASCII字符。以下程序段把所有可见字符的 ASCII码对照表打印到屏幕上(这里采用printf,注意“#”与“%X”合用时自动为16进制数增加“0X”前缀):

for (int i = 32; i < 127; i++)
{
    printf("[ %c ]: %3d 0x%#04X/n", i, i, i);
}

1.3用法3:连接字符串

sprintf的格式控制串中既然可以插入各种东西,并最终把它们“连成一串”,自然也就能够连接字符串,从而在许多场合可以替代 strcat,但 sprintf 能够一次连接多个字符串(自然也可以同时在它们中间插入别的内容,总之非常灵活)。比如:

char *who = "I";
char *whom = "C++";
sprintf(s, "%s love %s.", who, whom); // 产生:"I love C++. "

strcat 只能连接字符串(一段以 '\0' 结尾的字符数组或叫做字符缓冲,null-terminated-string),但有时我们有两段字符缓冲区,他们并不是以 '\0' 结尾。比如许多从第三方库函数中返回的字符数组,从硬件或者网络传输中读进来的字符流,它们未必每一段字符序列后面都有个相应的 '\0' 来结尾。如果直接连接,不管是 sprintf 还是 strcat 肯定会导致非法内存操作,而 strncat 也至少要求第一个参数是个 null-terminated-string(以null结尾的字符串),那该怎么办呢?我们自然会想起前面介绍打印整数和浮点数时可以指定宽度,字符串也一样的。比如:

char a1[] = {'A', 'B', 'C', 'D', 'E', 'F', 'G'};
char a2[] = {'H', 'I', 'J', 'K', 'L', 'M', 'N'};

如果:

sprintf(str, "%s%s", a1, a2); // Don't do that!

十有八九要出问题了。是否可以改成:

sprintf(str, "%7s%7s", a1, a2);

也没好到哪儿去,正确的应该是:

sprintf(str, "%.7s%.7s", a1, a2); // 产生:"ABCDEFGHIJKLMN"

这可以类比打印浮点数的“%m.nf”,在“%m.ns”中,m表示占用宽度(字符串长度不足时补空格,超出了则按照实际宽度打印),n才表示从相应的字符串中最多取用的字符数。通常在打印字符串时m没什么大用,还是点号后面的n用的多。自然,也可以前后都只取部分字符:

sprintf(str, "%.6s%.5s", a1, a2); // 产生:"ABCDEFHIJKL"

在许多时候,我们或许还希望这些格式控制符中用以指定长度信息的数字是动态的,而不是静态指定的,因为许多时候,程序要到运行时才会清楚到底需要取字符数组中的几个字符,这种动态的宽度/精度设置功能在 sprintf 的实现中也被考虑到了,sprintf 采用“*”来占用一个本来需要一个指定宽度或精度的常数数字的位置,同样,而实际的宽度或精度就可以和其它被打印的变量一样被提供出来,于是,上面的例子可以变成:

sprintf(str, "%.*s%.*s", 7, a1, 7, a2);

或者:

sprintf(str, "%.*s%.*s", sizeof(a1), a1, sizeof(a2), a2);

实际上,前面介绍的打印字符、整数、浮点数等都可以动态指定那些常量值,比如:

sprintf(s, "%-*d", 4, 'A');             // 产生 "65 "
sprintf(s, "%#0*X", 8, 128);            // 产生 "0X000080″,"#"产生0X
sprintf(s, "%*.*f", 10, 2, 3.1415926);  // 产生"      3.14″

1.4用法4:打印地址信息

有时调试程序时,我们可能想查看某些变量或者成员的地址,由于地址或者指针也不过是个32位的数,你完全可以使用打印无符号整数的“%u”把他们打印出来:

sprintf(s, "%u", &i);

不过通常人们还是喜欢使用16进制而不是10进制来显示一个地址:

sprintf(s, "%08X", &i);

然而,这些都是间接的方法,对于地址打印,sprintf 提供了专门的“%p”:

sprintf(s, "%p", &i);

实际上就相当于:

sprintf(s, "%0*x", 2 * sizeof(void *), &i);

1.5利用sprintf的返回值

较少有人注意 printf/sprintf 函数的返回值,但有时它却是有用的,sprintf 返回了本次函数调用最终打印到字符缓冲区中的字符数目。也就是说每当一次 sprinf 调用结束以后,你无须再调用一次strlen 便已经知道了结果字符串的长度。如:

int len = sprintf(s, "%d", i);

对于正整数来说,len便等于整数i的10进制位数。

下面的是个完整的例子,产生10个[0, 100)之间的随机数,并将他们打印到一个字符数组s中,以逗号分隔开。

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

int main(int argc, char **argv)
{
    srand(time(0));
    char s[64];
    int offset = 0;

    for (int i = 0; i < 10; i++)
    {
        offset += sprintf(s + offset, "%d, ", rand() % 100);
    }

    s[offset - 1] = '\n'; // 将最后一个逗号换成换行符。
    printf(s);

    return 0;
}

设想当你从数据库中取出一条记录,然后希望把他们的各个字段按照某种规则连接成一个字符串时,就可以使用这种方法,从理论上讲,他应该比不断的 strcat 效率高,因为 strcat 每次调用都需要先找到最后的那个 '\0' 的位置,而在上面给出的例子中,我们每次都利用 sprintf 返回值把这个位置直接记下来了。

1.6使用 sprintf 的常见问题

sprintf是个变参函数,使用时经常出问题,而且只要出问题通常就是能导致程序崩溃的内存访问错误,但好在由sprintf误用导致的问题虽然严重,却很容易找出,无非就是那么几种情况,通常用眼睛再把出错的代码多看几眼就看出来了。

1.缓冲区溢出

第一个参数的长度太短了,没的说,给个大点的地方吧。当然也可能是后面的参数的问题,建议变参对应一定要细心,而打印字符串时,尽量使用“%.ns”的形式指定最大字符数。

2.忘记了第一个参数

低级得不能再低级问题,用 printf 用得太惯了。// 偶就常犯。

3.变参对应出问题

通常是忘记了提供对应某个格式符的变参,导致以后的参数统统错位,检查检查吧。尤其是对应“*”的那些参数,都提供了吗?不要把一个整数对应一个“%s”,编译器会觉得你欺她太甚了。

2.snprintf() 详解

函数原型:

int snprintf(char *restrict_buf, size_t n, const char * restrict _format, ...);

函数说明:最多从源串中拷贝 n-1 个字符到目标串中,然后再在后面加一个 '\0'。所以如果目标串的大小为 n 的话,将不会溢出。

函数返回值:若成功则返回欲写入的字符串长度,若出错则返回负值。

1.推荐的用法

#include <stdio.h>

int main(int argc, char **argv)
{
    char str[10] = {0};
    snprintf(str, sizeof(str), "0123456789012345678");
    printf("str=%s\n", str);

    return 0;
}

输出:

str=012345678

2.不推荐的用法

#include <stdio.h>

int main(int argc, char** argv)
{
    char str[10] = { 0, };
    snprintf(str, 18, "0123456789012345678");
    printf("str=%s/n", str);

    return 0;

}

输出:

str=01234567890123456

3.snprintf() 函数返回值的测试:

#include <stdio.h>
#include <string.h>

int main(int argc, char** argv)
{
    char str1[10] = { 0, };
    char str2[10] = { 0, };
    int ret1 = 0, ret2 = 0;

    ret1 = snprintf(str1, sizeof(str1), "%s", "abc");
    ret2 = snprintf(str2, 4, "%s", "aaabbbccc");

    printf("aaabbbccc length=%d\n", strlen("aaabbbccc"));
    printf("str1=%s,ret1=%d\n", str1, ret1);
    printf("str2=%s,ret2=%d\n", str2, ret2);

    return 0;
}

输出:

aaabbbccc length=9
str1=abc,ret1=3
str2=aaa,ret2=9

特别注意:

snprintf() 的返回值是欲写入的字符串长度,而不是实际写入的字符串度。如:

#include <stdio.h>

int main(int argc, char** argv)
{
    char test[8];
    
    int ret = snprintf(test, 5, "1234567890");
    printf("%d|%s\n", ret, test);
    return 0;
}

输出:

10|1234

参考资料来源:[(7条消息) C 字符串函数 sprintf()、snprintf() 详解_snprintf 浮点数_LQJW的博客-CSDN博客](