文章概览
$X_0$是目标图像,$X_t$是加噪声的,$t \to \infin$时$X \to N(0,1)$
加噪声
令 $\alpha = 1-\beta$,则有
以此类推
因为独立高斯分布可加性
则
其中 $\beta_t$ 是由0.0001到0.02线性增大的,采用 $\sqrt{1-\beta_t}$ 的均值系数可以保证 t 无穷大时,x收敛到标准高斯分布
逆扩散
就是在学怎么加这个噪声,可以得到清晰图像
就是用神经网络(输入x和t)生成一个 $\epsilon_\theta$ 再经过公式计算,逆推就行
训练的时候用特殊的loss(?代码里用的可是简单的EMS嗷),对着随机生成的噪声学
马尔科夫链
每一个状态只与上一个状态有关
迁移概率矩阵
AB两个状态,A 到 A 的概率是 0.3,A 到 B 的概率是 0.7;B 到 B 的概率是 0.1,B 到 A 的概率是 0.9。问从A或B出发,两次运动后,在A或B状态的概率
状态转移矩阵的稳定性
经过有限次转换,可以得到一个稳定的概率分布
KL散度
求两个概率分布的差异程度
多想多做,发篇一作