KL散度

基本定义

$$ \begin{align*} &\text{KL}(P\|Q) = \sum P(x) \log\frac{P(x)}{Q(x)}\\[3ex] &\text{KL}(P\|Q) = \int P(x) \log\frac{P(x)}{Q(x)} dx

\end{align*} $$

相对熵

公式推导

  1. 动机:
  2. 推导:

交叉熵

交叉熵与KL散度的关系

交叉熵的应用

$$

L(\hat{y},y) = -\frac{1}{n} \sum_{i=1}^n \sum_{j=1}^k y_{ij} \log \hat{y}_{ij}

$$