【c&c++】C++中memset()函数的用法详解

发布时间 2023-09-21 11:36:12作者: opensmarty

头文件:cstring 或 memory

话说刚开始使用memset的时候一直以为memset是对每一个int赋值的,心里想有了memset还要for循环对数组进行初始化干嘛。但其实memset这个函数的作用是将数字以单个字节逐个拷贝的方式放到指定的内存中去

memset(dp,0,sizeof(dp));  

int类型的变量一般占用4个字节,对每一个字节赋值0的话就变成了“00000000 00000000 000000000 00000000” (即10进制数中的0)
赋值为-1的话,放的是 “11111111 11111111 11111111 11111111 ”(十进制的-1)
这样你可能以为如果你赋值1的话会让整个dp数组里的每一个int变成1,其实不然。

memset(dp,1,sizeof(dp));  

我们在很多程序中都会看到memset(a,127,sizeof(a));这样的代码,127是什么特别的数字呢?通过基础的进制转换可以得知127的二进制表示是01111111,那么在dp数组里放的内容就是“01111111 01111111 01111111 01111111”,(10进制的2139062143),这样就实现了将数组里的全部元素初始化为一个很大的数的目的了,在最短路径问题以及其他很多算法中都是需要用到的。值得注意的是,int类型的范围为2^31-1,大约是2147483647的样子(如果我没有记错的话),所以初始化int类型的数组也可以使用127这个数值。

如果是128呢?因为128的二进制是10000000,那么放的内容就是10000000 10000000 10000000 10000000,经过计算可得这个数是-2139062144。这样就可以将数组初始化为一个很小的数了。

 

memset的正规用法是只能用来初始化char类型的数组的,也就是说,它只接受0x00-0xFF的赋值。

因为char是1字节,memset是按照字节赋值的,相当于把每个字节都设为那个数,所以char型的数组可赋任意值;

而对于也常用的int类型,int是4个字节,当memset(,1,sizeof());时,1相当于ASSCII码的1,1转为二进制00000001,当做一字节,一字节8位,int为4字节,所以初始化完每个数为00000001000000010000000100000001 = 16843009;

memset(,0xff,sizeof()),0xff转为二进制11111111,int为4字节所以最后为11111111111111111111111111111111为-1。(化为二进制补位,然后再赋值)。

 可以全赋值为0,0的二进制位000000000000000000000000000000000,还可以是-1,-1的二进制就是11111111111111111111111111111111,所以memset可以直接初始化(0,-1);
例如:0xff转为二进制位11111111,正好是一位,0x1f小于0xff,而0x59也小于0xff,所以这些都可以用来初始化,只要能填满8位的二进制,就可以了。
如果你想初始最大化,第一位为符号位,不能为1,剩下全是1,也就是7个1,1111111化为十六进制正好为0x7f,所以memset(,0x7f,sizeof());就可以了

Memset中无穷大常量的设定技巧
如果问题中各数据的范围明确,那么无穷大的设定不是问题,在不明确的情况下,很多程序员都取0x7fffffff作为无穷大,因为这是32-bit int的最大值。如果这个无穷大只用于一般的比较(比如求最小值时min变量的初值),那么0x7fffffff确实是一个完美的选择,但是在更多的情况下,0x7fffffff并不是一个好的选择。
很多时候我们并不只是单纯拿无穷大来作比较,而是会运算后再做比较,例如在大部分最短路径算法中都会使用的松弛操作:
  if (d[u]+w[u][v]<d[v]) d[v]=d[u]+w[u][v];
我们知道如果u,v之间没有边,那么w[u][v]=INF,如果我们的INF取0x7fffffff,那么d[u]+w[u][v]会溢出而变成负数,我们的松弛操作便出错了,更一般的说,0x7fffffff不能满足“无穷大加一个有穷的数依然是无穷大”,它变成了一个很小的负数。
除了要满足加上一个常数依然是无穷大之外,我们的常量还应该满足“无穷大加无穷大依然是无穷大”,至少两个无穷大相加不应该出现灾难性的错误,这一点上0x7fffffff依然不能满足我们。
所以我们需要一个更好的家伙来顶替0x7fffffff,最严谨的办法当然是对无穷大进行特别处理而不是找一个很大很大的常量来代替它(或者说模拟它),但是这样会让我们的编程过程变得很麻烦。在我读过的代码中,最精巧的无穷大常量取值是0x3f3f3f3f,我不知道是谁最先开始使用这个精妙的常量来做无穷大,不过我的确是从一位不认识的ACMer(ID:Staginner)的博客上学到的,他/她的很多代码中都使用了这个常量,于是我自己也尝试了一下,发现非常好用,而当我对这个常量做更深入的分析时,就发现它真的是非常精巧了。

0x3f3f3f3f的十进制是1061109567,也就是10^9级别的(和0x7fffffff一个数量级),而一般场合下的数据都是小于10^9的,所以它可以作为无穷大使用而不致出现数据大于无穷大的情形。
另一方面,由于一般的数据都不会大于10^9,所以当我们把无穷大加上一个数据时,它并不会溢出(这就满足了“无穷大加一个有穷的数依然是无穷大”),事实上0x3f3f3f3f+0x3f3f3f3f=2122219134,这非常大但却没有超过32-bit int的表示范围,所以0x3f3f3f3f还满足了我们“无穷大加无穷大还是无穷大”的需求。
最后,0x3f3f3f3f还能给我们带来一个意想不到的额外好处:如果我们想要将某个数组清零,我们通常会使用memset(a,0,sizeof(a))这样的代码来实现(方便而高效),但是当我们想将某个数组全部赋值为无穷大时(例如解决图论问题时邻接矩阵的初始化),就不能使用memset函数而得自己写循环了(写这些不重要的代码真的很痛苦),我们知道这是因为memset是按字节操作的,它能够对数组清零是因为0的每个字节都是0,现在好了,如果我们将无穷大设为0x3f3f3f3f,那么奇迹就发生了,0x3f3f3f3f的每个字节都是0x3f!所以要把一段内存全部置为无穷大,我们只需要memset(a,0x3f,sizeof(a))。

所以在通常的场合下,0x3f3f3f3f真的是一个非常棒的选择。

其他赋值:

 memset(arr,0x7F,sizeof(arr)); //它将arr中的值全部赋为2139062143,这是用memset对int赋值所能达到的最大值
类似的还有:
memset(arr,0x80,sizeof(arr)); //set int to -2139062144
memset(arr,0x7F,sizeof(arr)); //set double to 1.38242e+306
memset(arr,0xFE,sizeof(arr)); //set double to -5.31401e+303

1. 函数介绍
包含头文件:#include<string.h>;
函数原型: void *memset(void *s , int ch , size_t n );
解释:
The memset() function fills the first n bytes of the memory area pointed to by s with the constant byte c.
将s所指向的某一块内存的前n个字节替换成c, 并返回指向内存s 的指针;
注意:
s可以为数组和结构体;
ch可以为数字,其对应ASCII的数值, 也可以为任意字符'';
n为长度, 为无符号整型变量;
函数作用和意义:
在一段内存块中填充某一个给定的值,常用于较大的对结构体和数组的清零操作.
2. 例子
2.1 初始化字符串列表

/* memset example */
#include <stdio.h>
#include <string.h>

int main ()
{
  char str[] = "almost every programmer should know memset!";
  memset (str,'-',6);
  puts (str);
  return 0;
}

输出为: ------ every programmer should know memset!.

2.2 初始化整型数组

#include<string.h>
#include<iostream>

int main()
{
int iBuf[10];
memset(iBuf, 0, sizeof(int) * 10);
for (int i = 0; i < 10; ++i)
{
    std::cout<<iBuf[i];
}
std::cout<<std::endl;

return 0;
}

输出: 0000000000

2.3 初始化结构体

#include<string.h>
#include<iostream>
#include<stdlib.h>

int main()
{
struct sample_struct
{
    char csName[16];
    int iSeq;
    int iType;
}stTest;
// struct sample_strcut stTest;
memset(&stTest,0,sizeof(struct sample_struct));
for (int i=0;i<16;i++)
{
    std::cout<<stTest.csName[i];
}
std::cout<<std::endl;
std::cout<<stTest.iSeq<<stTest.iType<<std::endl;
return 0;
}

输出:

00

3.注意事项

3.1 对字符指针所指区域初始化, 必须先分配内存;

#include<string.h>
#include<iostream>
#include<stdlib.h>

int main()
{
char* pBuf = (char *)malloc(sizeof(char) * 10);

if (pBuf != NULL)
{
    memset(pBuf, 97, sizeof(char) * 10);        // 97的ASCII值对应的是字符a
    for (int i = 0; i < 10; ++i)
    {
        std::cout<<pBuf[i];
    }
    std::cout<<std::endl;

    free(pBuf);
    pBuf = NULL;
}

return 0;
}

输出: aaaaaaaaaa

3.2 memset中的第三个参数 n 最好使用sizeof操作符,因为每个系统下对类型长度的定义可能不一样.

3.2 memset中的第三个参数 n 最好使用sizeof操作符,因为每个系统下对类型长度的定义可能不一样.

3.4 memset是按照 字节 为单位进行初始化的, 对于单字节数据类型char可以随意复制, 对于多字节数据类型则只能赋值为0.

#include<string.h>
#include<iostream>

int main()
{
int arr[10];
memset(arr,1,sizeof(int)*10);
for(int i=0; i<10;i++)
{
    std::cout<<arr[i]<<" ";
}
std::cout<<std::endl;
return 0;
}

输出:16843009 16843009 16843009 16843009 16843009 16843009 16843009 16843009 16843009 16843009
由于int占4个字节(byte),因此"1"对应的二进制(32bits下)为"00000000 00000000 00000000 00000001"(4bytes),塞到1byte(8bit)的中,高位被舍弃了。所以,填入数组中的值是"00000001"。然而总共有10×4=40个byte,所以数组每一个元素都是00000001 00000001 0000001 0000001 也就是 0x01010101=16843009

参考资料
function memset
透彻分析C/C++中memset函数
透彻分析C/C++中memset函数
C++memset()的使用(详细版)