深入理解 TLS 密钥协商

labuladong原创

前置知识

阅读本文前，你需要先学习：

深入理解数字证书和 CA

在深入理解数字证书和 CA 这篇文章中，我们学习了 HTTPS 如何通过数字证书验证服务器身份，防止中间人攻击。

文章讲到，浏览器通过证书链验证服务器身份后，就可以开始加密通信了。但是，具体怎么进行加密通信呢？

你可能会想：既然有了服务器的公钥，直接用它加密数据不就行了？

直接用非对称性加密和解密大量数据的效率比较差，所以最早的 TLS 版本（TLS 1.0/1.1/1.2）支持一种简单的密钥交换方式：RSA 密钥交换。

流程很直接，用非对称性秘钥加密一个对称性会话秘钥，然后用这个会话密钥进行加密通信：

浏览器验证服务器证书后，从证书中获取服务器的 RSA 公钥。
浏览器生成一个随机密钥，叫做「预主密钥」（Pre-Master Secret）。
浏览器用服务器的 RSA 公钥加密这个预主密钥。
发送给服务器，只有服务器能用私钥解密。双方对这个预主密钥做一些处理，推导出一个共享的会话密钥。
之后的通信都用会话密钥加密（对称加密，速度快）。

这个方案简单直接，证书的公钥既用于验证身份，又用于加密预主密钥。但是，RSA 密钥交换有一个致命的安全隐患：缺乏前向保密性（Forward Secrecy）。

想象这个场景：

2024年：黑客录制了你和银行服务器的加密通信，包括：

浏览器发送的预主密钥
所有加密的通信数据

2026年：银行服务器的私钥泄露了，黑客就可以：

用泄露的私钥解密 2024 年录制的预主密钥
推导出当年的会话密钥
解密当年的所有加密通信数据

只要服务器的私钥泄露，过去所有使用 RSA 密钥交换的通信都会被破解。这对于需要长期保密的数据（比如医疗记录、金融交易）来说，是不可接受的安全风险。

因此，现代 TLS 放弃了 RSA 密钥交换，转而使用 Diffie-Hellman 密钥交换。

Diffie-Hellman 密钥协商算法

Diffie-Hellman（DH）密钥交换是一种神奇的算法，它允许双方在不安全的信道上协商出一个共享密钥，即使黑客监听了整个过程，也无法计算出这个密钥。

就好比说，我们俩当着全世界的面，互相报几个数字，就可以拥有一个只有我们俩知道的秘密，而其他人却无法知道这个秘密。

听起来很玄乎，但其实原理并不复杂。

生活化比喻

在讲数学原理前，先用一个生活化的比喻来理解 DH 算法的核心思想。

假设 Alice 和 Bob 想在公开场合（黑客 Eve 在旁边监听）协商出一个共同的秘密颜色。

初始状态：
├─ 黄色是公开的基础颜色，Eve 知道
├─ Alice 有一个秘密颜色：红色，Eve 不知道
└─ Bob 有一个秘密颜色：蓝色，Eve 不知道

步骤 1：Alice 混合颜色
├─ Alice 把黄色 + 红色混合 → 得到橙色
└─ Alice 把橙色公开发送给 Bob（Eve 能看到橙色）

步骤 2：Bob 混合颜色
├─ Bob 把黄色 + 蓝色混合 → 得到绿色
└─ Bob 把绿色公开发送给 Alice（Eve 能看到绿色）

步骤 3：二次混合
├─ Alice 收到绿色，加入自己的红色 
|        绿色 + 红色 = 黄色 + 蓝色 + 红色 = 棕色
└─ Bob 收到橙色，加入自己的蓝色
         橙色 + 蓝色 = 黄色 + 红色 + 蓝色 = 棕色

结果：
├─ Alice 和 Bob 都得到了棕色（共享密钥）
└─ Eve 只能看到：黄色、橙色、绿色，无法得到棕色
    └─ 因为 Eve 不知道 Alice 的红色和 Bob 的蓝色