MD5加密算法

发布时间 2023-11-27 14:59:08作者: 上好佳28

MD5

MD5是一种不可逆的加密算法。可以产生出一个128位(16字节)的散列值(hash value),用于确保信息传输完整一致

md5的特性

  • 压缩性:任意长度的数据,算出的MD5值长度都是固定的。

  • 容易计算:从原数据计算出MD5值很容易。

  • 抗修改性:对原数据进行任何改动,哪怕只修改1个字节,所得到的MD5值都有很大区别。

  • 弱抗碰撞:已知原数据和其MD5值,想找到一个具有相同MD5值的数据(即伪造数据)是非常困难的

md5加密原理

MD5以512位分组来处理输入的信息,且每一分组又被划分为16个32位子分组,经过了一系列的处理后,算法的输出由四个32位分组组成,将这四个32位分组级联后将生成一个128位散列值

1、填充

在MD5算法中,首先需要对信息进行填充,使其位长对512求余的结果等于448,并且填充必须进行,即使其位长对512求余的结果等于448。因此,信息的位长(Bits Length)将被扩展至N*512+448,N为一个非负整数

填充的方法如下:

1) 在信息的后面填充一个1和无数个0,直到满足上面的条件时才停止用0对信息的填充。

2) 在这个结果后面附加一个以64位二进制表示的填充前信息长度(单位为Bit),如果二

进制表示的填充前信息长度超过64位,则取低64位。

经过这两步的处理,信息的位长=N512+448+64=(N+1)512,即长度恰好是512的整数倍

2、初始化变量

MD5中有四个32位被称作链接变量(Chaining Variable)的整数参数,他们分别为:A=0x01234567,B=0x89abcdef,C=0xfedcba98,D=0x76543210。当设置好这四个链接变量后,就开始进入算法的四轮循环运算,循环的次数是信息中512位信息分组的数目

3、处理分组数据

首先我们声明四个中间变量a,b,c,d,赋值:a = A, b = B, c = C, d = D

主循环有四轮(MD4只有三轮),每轮循环都很相似。第一轮进行16次操作。每次操作对a、b、c和d中的其中三个作一次非线性函数运算,然后将所得结果加上第四个变量(文本中的一个子分组和一个常数),再将所得结果向右环移一个不定的数

这些完成之后,将a、b、c、d分别在原来基础上再加上A、B、C、D,然后用该结果取代a、b、c、d,然后用下一分组数据继续运行算法

4、输出

最后的输出是a、b、c和d的级联,组成128位输出结果

撞库

从技术的角度来说,MD5真的很安全,因为MD5本身是不可逆的,因此没法解密,除了撞库这样的一个方式

通过建立大型数据库,将常用的各种句子密码等加密成为密文,并存储在数据库中;然后拿着密文到数据库网站查询,就有可能查到密码

在大数据时代,庞大的数据中收集了越来越多的原文密文字典,利用反查法(md5的缺点就是相同密码加密的结果是一样的,也就是同一个密码加密后具备唯一性的特征),只要字典中存在弱密码的md5加密串,那么就可以反向查找出对应密码

程序开发人员如何避免反查法,降低被解密的可能性,那么就需要使用盐值加密,加入一个随机盐,这样一定程度上可以防止md5大数据字典法解密用户信息。只要随机盐不泄露,那么被解密的风险就降低了