跳转到内容

交互式教学

理解 Gaussian Process
从先验到后验

从高斯过程的核心直觉出发,逐步理解 MCMC 如何采样后验分布,以及 HMC 如何利用物理动力学加速探索。每一步都有可视化演示。

什么是高斯过程?

高斯过程是函数空间上的概率分布。给定任意有限个输入点 \(x_1, \ldots, x_n\),对应的函数值 \(f(x_1), \ldots, f(x_n)\) 服从一个多元正态分布:

$$f(\mathbf{x}) \sim \mathcal{GP}\big(m(\mathbf{x}),\, k(\mathbf{x}, \mathbf{x}')\big)$$

其中 \(m(\mathbf{x})\) 为均值函数,\(k(\mathbf{x}, \mathbf{x}')\) 为核函数(协方差函数)。核函数编码了我们对函数平滑性、周期性等先验信念。

核函数家族

RBF (SE)

$$k(x,x') = \sigma^2 \exp\!\Big(-\frac{(x-x')^2}{2\ell^2}\Big)$$

无限可微,产生极其平滑的函数样本

Matérn 3/2

$$k(x,x') = \sigma^2\Big(1+\frac{\sqrt{3}|x-x'|}{\ell}\Big)\exp\!\Big(-\frac{\sqrt{3}|x-x'|}{\ell}\Big)$$

一阶可微,更适合金融数据等不要求无限光滑的场景

Periodic

$$k(x,x') = \sigma^2 \exp\!\Big(-\frac{2\sin^2(\pi|x-x'|/p)}{\ell^2}\Big)$$

捕捉周期性结构,可在本页手动调节周期 \(p\)

先验到后验

观察到数据 \(\mathcal{D} = \{(\mathbf{X}, \mathbf{y})\}\) 后,GP 后验预测为:

$$\mu_* = \mathbf{K}_{*f} [\mathbf{K}_{ff} + \sigma_n^2 \mathbf{I}]^{-1} \mathbf{y}$$
$$\Sigma_* = \mathbf{K}_{**} - \mathbf{K}_{*f} [\mathbf{K}_{ff} + \sigma_n^2 \mathbf{I}]^{-1} \mathbf{K}_{f*}$$

这个更新过程就是贝叶斯推断的精髓:先验 + 数据 → 后验。右侧的可视化展示了 GP 先验样本和加入观测点后的后验更新。

计算瓶颈:矩阵求逆 \([\mathbf{K}_{ff} + \sigma_n^2 \mathbf{I}]^{-1}\) 的复杂度为 \(\mathcal{O}(n^3)\),这是 GP 面对大数据集时的核心挑战。

点击画布添加观测点,切换「显示后验」查看 GP 如何更新预测

三者关系

GP
函数空间上的非参数贝叶斯模型
需要超参数推断 →
MCMC
从后验分布中采样的通用框架
梯度加速 →
HMC
利用哈密顿动力学的高效 MCMC