简介

MD5(Message-Digest Algorithm)是计算机安全领域广泛使用的散列函数(又称哈希算法、摘要算法),主要用来确保消息的完整和一致性。常见的应用场景有密码保护、下载文件校验等。

本文先对MD5的特点与应用进行简要概述,接着重点介绍MD5在密码保护场景下的应用,最后通过例子对MD5碰撞进行简单介绍。

特点

  1. 运算速度快:对jquery.js求md5值,57254个字符,耗时1.907ms
  2. 输出长度固定:输入长度不固定,输出长度固定(128位)。
  3. 运算不可逆:已知运算结果的情况下,无法通过通过逆运算得到原始字符串。
  4. 高度离散:输入的微小变化,可导致运算结果差异巨大。
  5. 弱碰撞性:不同输入的散列值可能相同。

应用场景

  1. 文件完整性校验:比如从网上下载一个软件,一般网站都会将软件的md5值附在网页上,用户下载完软件后,可对下载到本地的软件进行md5运算,然后跟网站上的md5值进行对比,确保下载的软件是完整的(或正确的)
  2. 密码保护:将md5后的密码保存到数据库,而不是保存明文密码,避免拖库等事件发生后,明文密码外泄。
  3. 防篡改:比如数字证书的防篡改,就用到了摘要算法。(当然还要结合数字签名等手段)

nodejs中md5运算的例子

在nodejs中,crypto模块封装了一系列密码学相关的功能,包括摘要运算。基础例子如下,非常简单:

  1. var crypto = require('crypto');
  2. var md5 = crypto.createHash('md5');
  3. var result = md5.update('a').digest('hex');
  4. // 输出:0cc175b9c0f1b6a831c399e269772661
  5. console.log(result);

例子:密码保护

前面提到,将明文密码保存到数据库是很不安全的,最不济也要进行md5后进行保存。比如用户密码是123456,md5运行后,得到输出:e10adc3949ba59abbe56e057f20f883e

这样至少有两个好处:

  1. 防内部攻击:网站主人也不知道用户的明文密码,避免网站主人拿着用户明文密码干坏事。
  2. 防外部攻击:如网站被黑客入侵,黑客也只能拿到md5后的密码,而不是用户的明文密码。

示例代码如下:

  1. var crypto = require('crypto');
  2. function cryptPwd(password) {
  3. var md5 = crypto.createHash('md5');
  4. return md5.update(password).digest('hex');
  5. }
  6. var password = '123456';
  7. var cryptedPassword = cryptPwd(password);
  8. console.log(cryptedPassword);
  9. // 输出:e10adc3949ba59abbe56e057f20f883e

单纯对密码进行md5不安全

前面提到,通过对用户密码进行md5运算来提高安全性。但实际上,这样的安全性是很差的,为什么呢?

稍微修改下上面的例子,可能你就明白了。相同的明文密码,md5值也是相同的。

  1. var crypto = require('crypto');
  2. function cryptPwd(password) {
  3. var md5 = crypto.createHash('md5');
  4. return md5.update(password).digest('hex');
  5. }
  6. var password = '123456';
  7. console.log( cryptPwd(password) );
  8. // 输出:e10adc3949ba59abbe56e057f20f883e
  9. console.log( cryptPwd(password) );
  10. // 输出:e10adc3949ba59abbe56e057f20f883e

也就是说,当攻击者知道算法是md5,且数据库里存储的密码值为e10adc3949ba59abbe56e057f20f883e时,理论上可以可以猜到,用户的明文密码就是123456

事实上,彩虹表就是这么进行暴力破解的:事先将常见明文密码的md5值运算好存起来,然后跟网站数据库里存储的密码进行匹配,就能够快速找到用户的明文密码。(这里不探究具体细节)

那么,有什么办法可以进一步提升安全性呢?答案是:密码加盐。

密码加盐

“加盐”这个词看上去很玄乎,其实原理很简单,就是在密码特定位置插入特定字符串后,再对修改后的字符串进行md5运算。

例子如下。同样的密码,当“盐”值不一样时,md5值的差异非常大。通过密码加盐,可以防止最初级的暴力破解,如果攻击者事先不知道”盐“值,破解的难度就会非常大。

  1. var crypto = require('crypto');
  2. function cryptPwd(password, salt) {
  3. // 密码“加盐”
  4. var saltPassword = password + ':' + salt;
  5. console.log('原始密码:%s', password);
  6. console.log('加盐后的密码:%s', saltPassword);
  7. // 加盐密码的md5值
  8. var md5 = crypto.createHash('md5');
  9. var result = md5.update(saltPassword).digest('hex');
  10. console.log('加盐密码的md5值:%s', result);
  11. }
  12. cryptPwd('123456', 'abc');
  13. // 输出:
  14. // 原始密码:123456
  15. // 加盐后的密码:123456:abc
  16. // 加盐密码的md5值:51011af1892f59e74baf61f3d4389092
  17. cryptPwd('123456', 'bcd');
  18. // 输出:
  19. // 原始密码:123456
  20. // 加盐后的密码:123456:bcd
  21. // 加盐密码的md5值:55a95bcb6bfbaef6906dbbd264ab4531

密码加盐:随机盐值

通过密码加盐,密码的安全性已经提高了不少。但其实上面的例子存在不少问题。

假设字符串拼接算法、盐值已外泄,上面的代码至少存在下面问题:

  1. 短盐值:需要穷举的可能性较少,容易暴力破解,一般采用长盐值来解决。
  2. 盐值固定:类似的,攻击者只需要把常用密码+盐值的hash值表算出来,就完事大吉了。

短盐值自不必说,应该避免。对于为什么不应该使用固定盐值,这里需要多解释一下。很多时候,我们的盐值是硬编码到我们的代码里的(比如配置文件),一旦坏人通过某种手段获知了盐值,那么,只需要针对这串固定的盐值进行暴力穷举就行了。

比如上面的代码,当你知道盐值是abc时,立刻就能猜到51011af1892f59e74baf61f3d4389092对应的明文密码是123456

那么,该怎么优化呢?答案是:随机盐值。

示例代码如下。可以看到,密码同样是123456,由于采用了随机盐值,前后运算得出的结果是不同的。这样带来的好处是,多个用户,同样的密码,攻击者需要进行多次运算才能够完全破解。同样是纯数字3位短盐值,随机盐值破解所需的运算量,是固定盐值的1000倍。

  1. var crypto = require('crypto');
  2. function getRandomSalt(){
  3. return Math.random().toString().slice(2, 5);
  4. }
  5. function cryptPwd(password, salt) {
  6. // 密码“加盐”
  7. var saltPassword = password + ':' + salt;
  8. console.log('原始密码:%s', password);
  9. console.log('加盐后的密码:%s', saltPassword);
  10. // 加盐密码的md5值
  11. var md5 = crypto.createHash('md5');
  12. var result = md5.update(saltPassword).digest('hex');
  13. console.log('加盐密码的md5值:%s', result);
  14. }
  15. var password = '123456';
  16. cryptPwd('123456', getRandomSalt());
  17. // 输出:
  18. // 原始密码:123456
  19. // 加盐后的密码:123456:498
  20. // 加盐密码的md5值:af3b7d32cc2a254a6bf1ebdcfd700115
  21. cryptPwd('123456', getRandomSalt());
  22. // 输出:
  23. // 原始密码:123456
  24. // 加盐后的密码:123456:287
  25. // 加盐密码的md5值:65d7dd044c2db64c5e658d947578d759

MD5碰撞

简单的说,就是两段不同的字符串,经过MD5运算后,得出相同的结果。

网上有不少例子,这里就不赘述,直接上例子,参考(这里)[http://www.mscs.dal.ca/~selinger/md5collision/]

  1. function getHashResult(hexString){
  2. // 转成16进制,比如 0x4d 0xc9 ...
  3. hexString = hexString.replace(/(\w{2,2})/g, '0x$1 ').trim();
  4. // 转成16进制数组,如 [0x4d, 0xc9, ...]
  5. var arr = hexString.split(' ');
  6. // 转成对应的buffer,如:<Buffer 4d c9 ...>
  7. var buff = Buffer.from(arr);
  8. var crypto = require('crypto');
  9. var hash = crypto.createHash('md5');
  10. // 计算md5值
  11. var result = hash.update(buff).digest('hex');
  12. return result;
  13. }
  14. var str1 = 'd131dd02c5e6eec4693d9a0698aff95c2fcab58712467eab4004583eb8fb7f8955ad340609f4b30283e488832571415a085125e8f7cdc99fd91dbdf280373c5bd8823e3156348f5bae6dacd436c919c6dd53e2b487da03fd02396306d248cda0e99f33420f577ee8ce54b67080a80d1ec69821bcb6a8839396f9652b6ff72a70';
  15. var str2 = 'd131dd02c5e6eec4693d9a0698aff95c2fcab50712467eab4004583eb8fb7f8955ad340609f4b30283e4888325f1415a085125e8f7cdc99fd91dbd7280373c5bd8823e3156348f5bae6dacd436c919c6dd53e23487da03fd02396306d248cda0e99f33420f577ee8ce54b67080280d1ec69821bcb6a8839396f965ab6ff72a70';
  16. var result1 = getHashResult(str1);
  17. var result2 = getHashResult(str2);
  18. if(result1 === result2) {
  19. console.log(`Got the same md5 result: ${result1}`);
  20. }else{
  21. console.log(`Not the same md5 result`);
  22. }

相关链接

MD5碰撞的一些例子
http://www.jianshu.com/p/c9089fd5b1ba

MD5 Collision Demo
http://www.mscs.dal.ca/~selinger/md5collision/

Free Password Hash Cracker
https://crackstation.net/