伯努利似然函数是统计学和机器学习中的一个基本概念,特别是在二分类问题的背景下

什么是伯努利分布?

<aside> ℹ️ 伯努利分布是一种离散概率分布,适用于只能取两个可能结果的随机变量

$$ P(n) = \begin{cases} 1 - p & \text{for } n = 0 \\ p & \text{for } n = 1 \end{cases} $$

</aside>

似然函数

单次观察的伯努利似然

$$

L(p \mid x) = p^x (1 - p)^{1 - x}\quad x\in\set{0,1} $$

多次观察的伯努利似然

$$

⁍ $$

$$ L(p \mid x_1, x_2, \ldots, x_n) = p^{\sum_{i=1}^n x_i} (1 - p)^{n - \sum_{i=1}^n x_i} $$

对数似然

$$

\begin{align*}\log L(p \mid x_1, x_2, \ldots, x_n) &= \sum_{i=1}^n \log(p^{x_i} (1 - p)^{1 - x_i})\\ &= \sum_{i=1}^n (x_i \log p + (1 - x_i) \log (1 - p)) \\ &= \left( \sum_{i=1}^n x_i \right) \log p + \left( n - \sum_{i=1}^n x_i \right) \log (1 - p) \end{align*} $$