简介
在概率统计学中,极大似然法(Maximum Likelihood Estimation, MLE)是一种估计参数的方法,其目的是在给定某个模型以及一些观测数据的情况下,利用极大似然函数求出模型中需要确定的参数值。在此基础上,本文将从原理、公式推导、实例以及应用等角度对二项分布的极大似然估计进行分析。
原理
对于二项分布而言,其似然函数为:
$L(p|n,x)=P(X=x|n,p)={n \choose x}p^x(1-p)^{n-x}$
其中p表示成功的概率,x表示实验中成功的次数,n表示实验总次数。
在似然函数中,x和n是已知的,p是未知的参数。求解参数p的MLE,即找到能最大化$L(p|n,x)$概率的参数值,通过对似然函数求导可以得到:
$\frac{dL(p|n,x)}{dp}=\frac{n-x}{1-p}-\frac{x}{p}=0$
化简后即可得到二项分布的MLE公式:
$p_{MLE}=\frac{x}{n}$
公式推导
二项分布的MLE公式是通过对其似然函数求导得到的。在二项分布的似然函数中,x和n是已知的值,因此只需要用p进行求导即可。具体求导过程如下:
$L(p|n,x)={n \choose x}p^x(1-p)^{n-x}$
$\frac{dL(p|n,x)}{dp}={n \choose x}x p^{x-1}(1-p)^{n-x}-{n \choose x}p^x(n-x)(1-p)^{n-x-1}$
$\frac{dL(p|n,x)}{dp}={n \choose x}p^{x-1}(1-p)^{n-x-1}[xp-(n-x)(1-p)]$
令$\frac{dL(p|n,x)}{dp}=0$,解得:
$p_{MLE}=\frac{x}{n}$
实例
假设我们有6个硬币,其中2个是正面朝上概率为0.3的偏态硬币,而另外4个是正面朝上概率为0.5的普通硬币。现在我们需要估计这些硬币中的偏态硬币的个数。因为每个硬币会进行100次实验,所以可以将偏态硬币的正面朝上概率p设定为0.3,计算每个硬币正面朝上的次数x。那么偏态硬币的个数即可用MLE公式p=x/n进行估计。计算如下:
硬币1:x=29,p=0.3, n=100,p_{MLE}=0.29
硬币2:x=33,p=0.3, n=100,p_{MLE}=0.33
硬币3:x=51,p=0.5, n=100,p_{MLE}=0.51
硬币4:x=49,p=0.5, n=100,p_{MLE}=0.49
硬币5:x=49,p=0.5, n=100,p_{MLE}=0.49
硬币6:x=47,p=0.5, n=100,p_{MLE}=0.47
因此,在6个硬币中,约有2个硬币是偏态硬币。
应用
二项分布的MLE在实际应用中非常广泛,尤其是在金融、医学、社会科学等领域。例如,在投资领域中,福利尔定律是指股票的价格取决于其收益率,而其收益率通常服从二项分布。因此,通过MLE估计参数,可以更准确地预测股票价格。在医学领域中,研究某种疾病的临床试验也是基于二项分布,通过MLE可以估计成功治愈的概率。在社会科学领域,二项分布可以用来研究选民投票行为,通过MLE可以估计某位候选人的得票率。