转载：MD5撞库

最新推荐文章于 2025-05-09 11:23:59 发布

AIxiaoming1105

最新推荐文章于 2025-05-09 11:23:59 发布

阅读量1.8k

点赞数

CC 4.0 BY-SA版权

分类专栏： Linux 文章标签：加密解密

原文链接：https://blog.csdn.net/weixin_44437000/article/details/97677657

Linux 专栏收录该内容

7 篇文章

订阅专栏

今天面试的时候，对自己项目里关于用到的MD5加密方式，面试官询问了一下对MD5撞库了解吗？我当时是一脸懵，没有涉及过安全领域的我从来没听说过，什么是撞库？MD5撞库又是什么？于是面试凉了

来网上搜集了一下撞库的资料，由于不是做安全方面的，不做具体深入的了解了。

首先是最常见的三种撞库方法：

第一种：用n个密码字典撞m个账号，这个的表象是，一个账号在某个较短的时间内，可能会有多次密码尝试。所以，可以在账号层加限制措施，比如：一天内，一个账号，密码错误次数超过5次时，1天之内禁止登陆（或者校验手机短信/密保问题之后才能登陆）。

第二种：用几个密码撞n个账号，这个的表象是，密码出现的频率会非常高，所以，可以统计一段时间内每个密码的错误次数，超过一定阈值时，这个密码在一段时间内禁止登录（或者校验手机短信/密保问题之后才能登陆）。

第三种：用n组一一对应的账号密码来再撞库，这种情况的撞库单纯从账号、密码的维度来看，不会有明显的异常。所以，需要一些其他的应对措施。比如：

1）IP封禁，如果一段时间内，单个IP地址，密码错误次数超过阈值，则禁止这个IP一段时间再登录（或者校验手机短信/密保问题之后才能登陆）。不过，如大家所说，现在代理IP相当廉价，从IP层面来封禁基本上没啥作用。

2）建立IP画像库，对代理IP、IDC IP等高危的IP直接禁止登陆（或者校验手机短信/密保问题之后才能登陆）。自己建立IP画像库成本可能会有点高，可以考虑采购安全厂商的类似服务。

3）现在比较火的行为验证码，比如：拖条、点选、拼图等各种花样的验证码。只是说，如果之前登录不需要验证码，现在要加上一个验证码，估计要和产品撕逼。一般来说最后为了后期的运营，产品也会同意加上验证码。

4）从设备层面来识别和封禁，通过在客户端植入sdk，收集用户端的设备信息，从设备层面来做高频策略，或者，直接识别出非正常的设备，然后对设备进行封杀。

5）从行为层面来识别和封禁，和上面一条一样，通过客户端植入sdk，收集用户在登录页面的交互行为，通过机器学习、大数据建模，训练出正常用户、异常用户的行为模型，在交互行为层面，将撞库的行为识别出来。这个需要有预先训练好的行为模型，现在机器学习那么好，不说大家也都知道，自己训练一个模型肯定需要很多标注数据，这也就意味着成本。所以，还是建议寻找安全厂商还做，毕竟专业的人做专业的事，靠谱！

原文链接：https://blog.csdn.net/wangyiyungw/article/details/84584163

然后md加密发展历史

MD2
## Rivest在1989年开发出MD2算法。在这个算法中，首先对信息进行数据补位，使信息的字节长度是16的倍数。然后，以一个16位的校验和追加到信息末尾，并且根据这个新产生的信息计算出散列值。后来，Rogier和Chauvaud发现如果忽略了校验和MD2将产生冲突。MD2算法加密后结果是唯一的（即不同信息加密后的结果不同）。 MD4 为了加强算法的安全性，Rivest在1990年又开发出MD4算法。**

MD4
MD4算法同样需要填补信息以确保信息的比特位长度减去448后能被512整除（信息比特位长度mod 512 =448）。然后，一个以64位二进制表示的信息的最初长度被添加进来。信息被处理成512位damg?rd/merkle迭代结构的区块，而且每个区块要通过三个不同步骤的处理。Denboer和Bosselaers以及其他人很快的发现了攻击MD4版本中第一步和第三步的漏洞。Dobbertin向大家演示了如何利用一部普通的个人电脑在几分钟内找到MD4完整版本中的冲突（这个冲突实际上是一种漏洞，它将导致对不同的内容进行加密却可能得到相同的加密后结果）。毫无疑问，MD4就此被淘汰掉了。尽管MD4算法在安全上有个这么大的漏洞，但它对在其后才被开发出来的好几种信息安全加密算法的出现却有着不可忽视的引导作用。

MD5
1991年，Rivest开发出技术上更为趋近成熟的md5算法。它在MD4的基础上增加了"安全-带子"（safety-belts）的概念。虽然MD5比MD4复杂度大一些，但却更为安全。这个算法很明显的由四个和MD4设计有少许不同的步骤组成。在MD5算法中，信息-摘要的大小和填充的必要条件与MD4完全相同。Den boer和Bosselaers曾发现MD5算法中的假冲突（pseudo-collisions），但除此之外就没有其他被发现的加密后结果了。

这些就是现在MD5的历史，那么接下来我们就在来聊下密码破解

- md5在理论上是几乎无法破解的，但是可以撞库。
撞库攻击也就是黑客通过收集互联网已泄露的用户+密码信息，生成对应的字典表，尝试批量登陆其他网站后，得到一系列可以登陆的用户，这样一旦用户为了省事，在多个网站设置了同样的用户名和密码的话，黑客很容易就会通过字典中已有的信息，登录到这些网站，从而获得用户的相关信息，如：手机号码、身份证号码、家庭住址，支付宝及网银信息等。这些信息泄露后，不仅会给用户和精神和经济带来巨大损失，同时也会给相关网站带来负面影响。简单理解撞库就是黑客无聊的“恶作剧”，