交互式教学
理解 Gaussian Process
从先验到后验
从高斯过程的核心直觉出发,逐步理解 MCMC 如何采样后验分布,以及 HMC 如何利用物理动力学加速探索。每一步都有可视化演示。
什么是高斯过程?
高斯过程是函数空间上的概率分布。给定任意有限个输入点 \(x_1, \ldots, x_n\),对应的函数值 \(f(x_1), \ldots, f(x_n)\) 服从一个多元正态分布:
其中 \(m(\mathbf{x})\) 为均值函数,\(k(\mathbf{x}, \mathbf{x}')\) 为核函数(协方差函数)。核函数编码了我们对函数平滑性、周期性等先验信念。
核函数家族
RBF (SE)
$$k(x,x') = \sigma^2 \exp\!\Big(-\frac{(x-x')^2}{2\ell^2}\Big)$$
无限可微,产生极其平滑的函数样本
Matérn 3/2
$$k(x,x') = \sigma^2\Big(1+\frac{\sqrt{3}|x-x'|}{\ell}\Big)\exp\!\Big(-\frac{\sqrt{3}|x-x'|}{\ell}\Big)$$
一阶可微,更适合金融数据等不要求无限光滑的场景
Periodic
$$k(x,x') = \sigma^2 \exp\!\Big(-\frac{2\sin^2(\pi|x-x'|/p)}{\ell^2}\Big)$$
捕捉周期性结构,可在本页手动调节周期 \(p\)
先验到后验
观察到数据 \(\mathcal{D} = \{(\mathbf{X}, \mathbf{y})\}\) 后,GP 后验预测为:
这个更新过程就是贝叶斯推断的精髓:先验 + 数据 → 后验。右侧的可视化展示了 GP 先验样本和加入观测点后的后验更新。
点击画布添加观测点,切换「显示后验」查看 GP 如何更新预测
MCMC:从后验分布中采样
当 GP 的超参数后验无法解析求解时,我们先做正参数变换,令 \(z=(\log \ell, \log \sigma_f)\),再在 \(z\)-空间上使用 MCMC 采样;这等价于在原始正参数上使用对数正态先验。
Metropolis-Hastings 算法
关键问题:随机游走的诅咒
标准 MCMC(Random Walk MH)在高维空间中效率极低。步长必须与 \(d^{-1/2}\) 成比例缩小以维持合理的接受率(最优约 23.4%),导致:
- 混合时间随维度 \(d\) 以 \(\mathcal{O}(d^2)\) 增长
- 链在目标分布的局部区域「随机游走」,难以快速遍历整个分布
- 自相关性高,有效样本量(ESS)低
收敛诊断
超参数空间 (ℓ, σf)
实现说明:采样在 z = (log ℓ, log σ_f) 空间进行,并以原始 (ℓ, σ_f) 坐标显示轨迹。
当前超参数对应的 GP 后验
在 GP 超参数后验上运行 MH 采样——实际采样在 \(z=(\log \ell, \log \sigma_f)\) 空间完成,上图仅把样本映射回 \((\ell, \sigma_f)\) 坐标显示
HMC:物理直觉驱动的高效采样
Hamiltonian Monte Carlo (HMC) 借用经典力学的哈密顿动力学,把 MCMC 采样变成一个物理系统的模拟。本演示在 \(z=(\log \ell, \log \sigma_f)\) 空间中运行 HMC。核心思想:
哈密顿方程
引入辅助动量变量 \(\mathbf{p}\),定义哈密顿量:
系统按哈密顿方程演化:
Leapfrog 积分器
重复 \(L\) 步后,用 Metropolis 准则接受/拒绝。Leapfrog 的辛性质(symplectic property)保证了哈密顿量近似守恒,使接受率极高。
HMC vs MCMC 核心对比
| Random Walk MH | HMC | |
|---|---|---|
| 提议机制 | 随机扰动(各向同性) | 沿梯度的确定性轨迹 |
| 混合速度 | \(\mathcal{O}(d^2)\) | \(\mathcal{O}(d^{5/4})\) |
| 最优接受率 | ~23.4% | ~65% |
| 梯度需求 | 不需要 | 需要 \(\nabla \log p(z)\) |
| 高维表现 | 灾难性退化 | 扩展性良好 |
NUTS:自适应 HMC
No-U-Turn Sampler (NUTS) 自动调节轨迹长度 \(L\),通过检测 U-turn 条件 \(\mathbf{p} \cdot (z - z_0) < 0\) 避免不必要的计算。Stan、PyMC、NumPyro 均默认使用 NUTS。
超参数空间 (ℓ, σf)
实现说明:采样在 z = (log ℓ, log σ_f) 空间进行,并以原始 (ℓ, σ_f) 坐标显示轨迹。
当前超参数对应的 GP 后验
对比 HMC(蓝色)与 MH(红色)在 GP 超参数后验上的采样效率,下图实时显示 GP 预测