当前位置：首页 > news >正文

密码学基石：哈希、对称/非对称加密与HTTPS实践详解

news 2025/11/4 23:29:46

密码学是现代信息安全的基石，它提供了一系列强大的数学工具和技术，用于保护数据的机密性、完整性和真实性，并确保通信双方的身份可被认证。在纷繁复杂的网络世界中，无论是安全的网页浏览 (HTTPS)、安全的软件更新、还是用户密码的存储，都离不开密码学的支撑。

一、哈希函数 (Hash Functions)：数据的"数字指纹"

哈希函数是一种能将任意长度的输入数据（也称为"消息"或"原文"）通过一个确定性的算法，转换成一个固定长度的输出字符串（称为"哈希值"、"消息摘要"或"数字指纹"）的函数。

核心特性：

确定性 (Deterministic)：相同的输入总是产生相同的哈希值。
快速计算 (Fast to Compute)：对于任意给定的输入，计算其哈希值都应该非常迅速。
单向性/不可逆性 (Pre-image Resistance)：从哈希值几乎不可能（计算上不可行）反向推导出原始输入数据。就像你很难从指纹反推出完整的人一样。
弱抗碰撞性 (Second Pre-image Resistance)：对于一个给定的输入，找到另一个不同的输入，使得两者具有相同的哈希值，应该是计算上不可行的。
强抗碰撞性 (Collision Resistance)：找到任意两个不同的输入，使得它们具有相同的哈希值，应该是计算上不可行的。
雪崩效应 (Avalanche Effect)：原始输入数据即使发生极微小的改变（例如，只改变一个比特），其生成的哈希值也会发生巨大的、不可预测的变化。

常见应用场景：

数据完整性校验：下载文件后，计算其哈希值并与官方提供的哈希值对比，可以验证文件在传输过程中是否被篡改。
密码存储：存储用户密码的哈希值而不是明文密码，即使数据库泄露，攻击者也无法直接获取用户密码。
数字签名：对消息的哈希值进行签名，而不是对整个消息签名，可以提高效率。
数据索引与查找：哈希表（Hash Table）的实现基础。

MD5 vs SHA-256：安全性的演进

MD5 (Message Digest Algorithm 5)：
- 产生一个 128 位（16字节）的哈希值。
- MD5 在早期被广泛使用，但由于王小云教授等人的研究，其强抗碰撞性已被攻破。这意味着可以相对容易地找到两个不同的输入产生相同的 MD5 哈希值。
- 因此，MD5 不再被认为是安全的，绝对不应用于密码存储、数字签名或任何对安全性要求较高的场景。
SHA-256 (Secure Hash Algorithm 256-bit)：
- 属于 SHA-2 (Secure Hash Algorithm 2) 家族的一员，产生一个 256 位（32字节）的哈希值。
- 截至目前，SHA-256 仍然被认为是安全的，具有良好的抗碰撞性。
- 是目前密码存储、数字签名、区块链技术（如比特币）等安全应用中的推荐选择。

密码存储最佳实践：加盐哈希 (Salted Hashing)

仅仅对密码进行哈希（即使是 SHA-256）仍然不够安全，因为它无法抵御"彩虹表攻击" (Rainbow Table Attack)。彩虹表是预先计算好的常见密码与其哈希值的对应表，攻击者拿到哈希后的密码库后，可以通过查表快速破解那些使用了常见密码的账户。

"加盐" (Salting) 是解决此问题的关键：

什么是盐 (Salt)？ 盐是一个为每个用户密码独立生成的、足够长的随机字符串。
如何工作？
- 当用户创建或修改密码时，系统为其生成一个唯一的盐。
- 将用户的明文密码和这个盐拼接起来（或者以其他方式组合）。
- 对拼接后的字符串使用安全的哈希函数（如 SHA-256 或更强的 bcrypt, scrypt, Argon2）计算哈希值。
- 将计算得到的哈希值和盐本身一起存储在数据库中。盐不需要保密，但必须与对应的密码哈希一起存储。
验证过程：
- 当用户尝试登录时，系统从数据库中根据用户名取出对应的盐和存储的哈希值。
- 将用户输入的密码和取出的盐进行相同的拼接操作。
- 对拼接后的结果使用相同的哈希函数计算新的哈希值。
- 比较新计算的哈希值与数据库中存储的哈希值是否一致。如果一致，则密码正确。

加盐的好处：

抵御彩虹表攻击：由于每个用户的盐都是不同的，即使两个用户使用了相同的密码，他们存储的哈希值也会因为盐的不同而不同。攻击者无法为所有可能的盐和密码组合预先计算彩虹表。
增加破解难度：攻击者即使获取了数据库，也必须对每个用户的哈希值进行单独的暴力破解或字典攻击，因为每个哈希都包含了唯一的盐。

更强的密码哈希算法：

对于密码存储，除了 SHA-256，更推荐使用专门为密码哈希设计的算法，如 bcrypt, scrypt, Argon2 (Argon2id 是 Argon2 的推荐变体，也是密码哈希竞赛的获胜者)。这些算法的特点是：

计算缓慢 (Computationally Intensive)：它们被设计成故意消耗较多的 CPU 和/或内存资源，使得暴力破解的成本极高，即使使用专用硬件（如 GPU、ASIC）也难以快速破解。
可配置的工作因子 (Work Factor / Cost Factor)：可以调整算法的计算成本，随着计算硬件的进步，可以增加工作因子以保持安全性。

二、对称加密 (Symmetric Encryption)：共享密钥的艺术

对称加密是指在加密和解密数据时使用相同的密钥的加密算法。

工作原理：

发送方使用一个共享密钥将明文数据加密成密文。
接收方使用完全相同的共享密钥将密文解密回明文。

常用算法：

AES (Advanced Encryption Standard)：目前最流行和广泛使用的对称加密算法。它是一种分组密码，支持 128位、192位、256位长度的密钥，安全性高，性能好。已被美国政府采纳为标准，并在全球范围内广泛应用。
DES (Data Encryption Standard)：较早的对称加密标准，密钥长度为 56位，已被认为不安全，容易被暴力破解。
3DES (Triple DES)：通过对数据执行三次 DES 来增强安全性，但效率较低，正逐渐被 AES 取代。

优点：

加解密速度快：相比非对称加密，对称加密的计算效率通常要高得多，适合加密大量数据。

缺点：

密钥分发困难 (Key Distribution Problem)：在通信双方开始加密通信之前，必须找到一种安全的方式将共享密钥传递给对方。如果密钥在传输过程中被窃取，那么整个加密通信的安全性就荡然无存。这是对称加密面临的最大挑战。
密钥管理复杂：在多方通信的场景下，每对通信方都需要一个独立的共享密钥，导致密钥数量急剧增加，管理困难。

三、非对称加密 (Asymmetric Encryption)：公私钥的魔法

非对称加密，也称为公钥加密 (Public-key Cryptography)，是指在加密和解密数据时使用一对不同的密钥：一个公钥 (Public Key) 和一个私钥 (Private Key)。

密钥对特性：

公钥是公开的，任何人都可以获取。
私钥由所有者严格保密，绝不能泄露。
用公钥加密的数据，只能用其对应的私钥才能解密。
用私钥加密（通常称为"签名"）的数据，可以用其对应的公钥来验证（解密）。
从公钥几乎不可能（计算上不可行）推导出私钥。

工作原理（用于加密通信）：

接收方 Bob 生成一对公私钥，并将公钥发布出去（例如，发送给发送方 Alice，或存放在公共的密钥服务器上）。Bob 自己保管私钥。
发送方 Alice 想要向 Bob 发送机密信息。她使用 Bob 的公钥将明文数据加密成密文。
Alice 将密文发送给 Bob。
Bob 收到密文后，使用他自己的私钥进行解密，得到原始明文。

由于只有 Bob 持有对应的私钥，所以即使密文在传输过程中被第三方截获，只要 Bob 的私钥没有泄露，第三方也无法解密密文。

常用算法：

RSA (Rivest-Shamir-Adleman)：基于大整数因子分解难题，是目前应用最广泛的非对称加密算法。可用于加密和数字签名。
ECC (Elliptic Curve Cryptography，椭圆曲线密码学)：基于椭圆曲线离散对数难题。与 RSA 相比，ECC 可以用更短的密钥长度达到同等的安全强度，因此在资源受限的设备（如移动设备、IoT设备）上更具优势，密钥生成和签名速度也更快。
Diffie-Hellman 密钥交换：严格来说它是一个密钥协商协议，而不是直接的加密算法，它允许双方在不安全的信道上安全地协商出一个共享密钥，用于后续的对称加密通信。

优点：

解决了密钥分发问题：发送方只需要获取接收方的公钥即可加密数据，无需事先安全地交换共享密钥。
可用于数字签名：私钥持有者可以用私钥对数据进行签名，任何人都可以用其公钥验证签名的真实性和数据的完整性（详见数字签名部分）。

缺点：

加解密速度慢：相比对称加密，非对称加密的计算复杂度要高得多，不适合加密大量数据。

四、HTTPS 实践：对称与非对称加密的完美结合

HTTPS (Hypertext Transfer Protocol Secure) 是在不安全的 HTTP 协议基础上，通过结合 SSL/TLS (Secure Sockets Layer / Transport Layer Security) 协议来实现的安全网页浏览。SSL/TLS 巧妙地利用了对称加密和非对称加密的各自优点，实现了既安全又高效的通信。

HTTPS 的主要目标：

机密性 (Confidentiality)：对浏览器和服务器之间的通信数据进行加密，防止被窃听。
完整性 (Integrity)：确保数据在传输过程中没有被篡改。
身份认证 (Authentication)：验证网站服务器的真实身份，防止用户访问到仿冒的钓鱼网站 (通过 SSL/TLS 证书实现)。

HTTPS (SSL/TLS) 握手过程简述 (以 RSA 密钥交换为例)：

客户端问候 (Client Hello)：浏览器（客户端）向服务器发送一个 "Client Hello" 消息，包含：
- 客户端支持的 SSL/TLS 版本号。
- 一个客户端生成的随机数 (Client Random)。
- 客户端支持的加密套件列表 (Cipher Suites，指明了对称加密算法、密钥交换算法、消息认证码算法等)。
- 客户端支持的压缩方法列表。
服务器响应 (Server Hello & Certificate & Server Key Exchange & Server Hello Done)：服务器从客户端提供的加密套件中选择一套双方都支持的，并向客户端发送：
- "Server Hello" 消息，包含：
  - 服务器选择的 SSL/TLS 版本号。
  - 一个服务器生成的随机数 (Server Random)。
  - 服务器选择的加密套件。
  - 服务器选择的压缩方法。
- 服务器证书 (Certificate)：服务器将其 SSL/TLS 证书（其中包含服务器的公钥，并由受信任的 CA 签名）发送给客户端。客户端会验证该证书的有效性（是否由可信 CA 签发、是否过期、域名是否匹配等）。
- (可选) Server Key Exchange：如果证书中的公钥不足以进行密钥交换（例如，使用的是仅用于签名的 DSS 证书，或者需要进行临时的 Diffie-Hellman 密钥交换），服务器会发送此消息，包含进行密钥交换所需的额外参数。
- "Server Hello Done" 消息：告知客户端，服务器的初始协商消息已发送完毕。
客户端密钥交换与验证 (Client Key Exchange & Change Cipher Spec & Encrypted Handshake Message)：
- 客户端验证服务器证书通过后，会生成另一个随机数，称为 "Pre-Master Secret"。
- Client Key Exchange：客户端使用服务器证书中的公钥将这个 "Pre-Master Secret" 加密后发送给服务器。
- 客户端和服务器现在都拥有了三个随机数：Client Random, Server Random, Pre-Master Secret。双方使用这三个随机数，通过一个预定义的伪随机函数 (PRF) 生成一个主密钥 (Master Secret)。然后，再从主密钥派生出会话密钥 (Session Keys)，包括用于对称加密的密钥、用于消息认证码 (MAC) 的密钥等。
- Change Cipher Spec：客户端通知服务器，从现在开始，后续的通信将使用协商好的会话密钥进行加密。
- Encrypted Handshake Message (Finished)：客户端将之前所有握手消息的哈希值用协商好的会话密钥加密后发送给服务器，供服务器校验握手过程的完整性。
服务器完成握手 (Change Cipher Spec & Encrypted Handshake Message)：
- 服务器使用自己的私钥解密客户端发送过来的加密的 "Pre-Master Secret"。然后执行与客户端相同的步骤生成主密钥和会话密钥。
- Change Cipher Spec：服务器通知客户端，它也将开始使用协商好的会话密钥进行加密通信。
- Encrypted Handshake Message (Finished)：服务器也将之前所有握手消息的哈希值用协商好的会话密钥加密后发送给客户端，供客户端校验。
安全通信开始：如果双方都成功验证了对方的 "Finished" 消息，则 SSL/TLS 握手完成。后续的应用层数据（HTTP 请求和响应）都将使用协商好的对称加密算法和会话密钥进行加密传输，并使用消息认证码确保完整性。

总结 HTTPS 中的密码学应用：

非对称加密 (如 RSA)：主要用于 SSL/TLS 握手阶段，安全地交换 Pre-Master Secret（或者用于服务器身份认证和密钥协商参数的签名）。它解决了对称加密密钥分发的难题。
对称加密 (如 AES)：用于 SSL/TLS 握手完成后的实际应用数据加密。它提供了高效的数据加密能力。
哈希函数 (如 SHA-256)：用于生成数字证书中的指纹、验证消息完整性 (HMAC)、生成密钥等。
数字证书与 PKI (公钥基础设施)：用于验证服务器身份的真实性。

通过这种混合加密方式，HTTPS 兼顾了安全性和效率，为我们的在线活动提供了坚实的保护。