首页 > 世链号 > Maximum Likelihood Estimation（MLE）极大似然估计

链讯管理局 2020-08-07

Maximum Likelihood Estimation（MLE）极大似然估计

摘要：Maximum Likelihood Estimation（MLE）极大似然估计，又被称作最大似然估计。其可在给定概率分布模型的条件下用于模型参数的估计，即所谓的参数估计

（给算法爱好者加星标，修炼编程内功）

来源：程序员 Aaron Zhu

Maximum Likelihood Estimation(MLE) 极大似然估计，又被称作最大似然估计。其可在给定概率分布模型的条件下用于模型参数的估计，即所谓的参数估计

Maximum Likelihood Estimation(MLE) 极大似然估计

基本原理

在此之前，我们先来了解下 P(x;θ)，其中 x 就是概率中常见的随机变量，而θ则是该概率分布模型的模型参数。在不同概率分布模型中有各自不同的模型参数，比如二项分布的р，正态分布的μ、σ。一般情况下我们见到更多的是，概率分布的模型参数θ是已知的、确定的，则此时 P(x;θ) 就是我们常见的在确定的分布模型下随机变量 x 的概率；而如果反过来，随机变量 x 是已知的，则此时 P(x;θ) 表示的就是在不同的模型参数θ条件下出现给定样本 x 的概率。这就是对于 P(x;θ) 理解的一体两面。显然在参数估计过程中，对 P(x;θ) 取后一种理解

所谓参数估计，就是估计出概率分布中的模型参数θ。为此我们会首先进行 n 次抽样实验，记抽样结果为。那仅仅根据这 n 个抽样结果，该如何估计出此概率分布的模型参数呢？这就引入了我们的今天的主题了——MLE 极大似然估计。其依据的思想也很简单，即概率越大越有可能发生 (最大似然可以理解为最为相似，即最大的可能性)。即使得当前抽样结果发生概率 L(θ) 最大的模型参数θ，就是我们所需的参数估计值。即

Maximum Likelihood Estimation(MLE) 极大似然估计

其中 L(θ) 被称为样本的似然函数。大多数情况下，n 次抽样实验相互之间满足独立同分布 (i.i.d)，则有

Maximum Likelihood Estimation(MLE) 极大似然估计

在了解了 MLE 的基本原理后，让我们总结下 MLE 极大似然估计在参数估计过程中的基本步骤：

建立似然函数 L(θ)
对 L(θ) 取对数，得对数似然函数 lnL(θ)
lnL(θ) 对θ求导并令其为 0，计算极值点
模型参数θ得解

上述流程相信大家都能看懂，唯一可能让人感到疑惑的地方在于第 2 点，为啥要取对数呢？这是由于一方面 ln 对数单调递增的特性使得其不会改变极值点；而更重要的原因在于取对数后方便我们后续的求导工作，这一点将会在下面的例子中体现的更加明显。事实上，取对数也是大家日常工作开发中经常会使用到的一项数据处理技巧

离散型概率分布

说了这么多，我们通过一个实际例子来展示如何具体的通过 MLE 来进行参数估计。这里我们以离散型概率分布中的二项分布为例

有一个不透明的袋子，里面装了黑、白两种颜色的球。记从袋子中摸到黑球、白球的概率分别为 p、1-p。假设某人进行了 10 次随机抽样，每次都是有放回的从袋子中摸出一个球，其抽样结果为 7 次黑球、3 次白球。试估计出概率 p 的值

如果我们希望利用 MLE 估计该模型参数 p 的值，则首先第一步需要建立似然函数 L(p)。显然该概率分布为二项分布，则有

Maximum Likelihood Estimation(MLE) 极大似然估计

对其取对数

然后对 p 求导并令其为 0，有

最后，求解上式可得 p = 0.7

连续型概率分布

在连续型概率分布中，其不存在分布律，取而代之的是概率密度函数 f。则对于 n 个样本而言，其概率可近似地为

但由于因子并不随θ变化，故在连续型概率分布下其似然函数为

Maximum Likelihood Estimation(MLE) 极大似然估计

这里，我们选用典型的正态分布作为实例，来展示如何通过 MLE 对正态分布的模型参数进行估计。根据上文可知，我们可直接通过概率密度函数来构建似然函数

Maximum Likelihood Estimation(MLE) 极大似然估计

对其取对数

Maximum Likelihood Estimation(MLE) 极大似然估计

然后分别对模型参数求偏导并令其为 0，有

Maximum Likelihood Estimation(MLE) 极大似然估计

最后，求解上式，可得正态分布的模型参数在 MLE 下的估计值

Maximum Likelihood Estimation(MLE) 极大似然估计

可以看到对于正态分布而言，其均值的极大似然估计量即是样本的均值；而其方差的极大似然估计量却是样本数据的总体方差值 (即分母为 n) ，而不是样本数据的样本方差值 (即分母为 n-1) ，故正态分布方差的极大似然估计量是有偏的

参考文献

程序员的数学 2·概率统计平冈和幸、堀玄著
现代心理与教育统计学张厚粲、徐建平著

来源链接：mp.weixin.qq.com
来源：算法爱好者

Tags:

哈希法

免责声明: 世链财经作为开放的信息发布平台，所有资讯仅代表作者个人观点，与世链财经无关。如文章、图片、音频或视频出现侵权、违规及其他不当言论，请提供相关材料，发送到：2785592653@qq.com。; 风险提示：本站所提供的资讯不代表任何投资暗示。投资有风险，入市须谨慎。; 世链粉丝群：提供最新热点新闻，空投糖果、红包等福利，微信：msy2134。

快讯

2024年05月06日星期一

Maximum Likelihood Estimation（MLE）极大似然估计

基本原理

离散型概率分布

连续型概率分布

参考文献

73 岁 Hinton 老爷子构思下一代神经网络：属于无监督对比学习

“任性”的 C 语言之父：因拒付论文装订费错失博士学位，论文 52 年后重见天日

高频面试知识点总结：面试官问我高并发服务模型哪家强？

换人！这些算法都不会还学什么操作系统

图解一致性哈希算法，全网（小区局域网）最通俗易懂

快讯

派盾：Alameda/FTX标签地址将约2000枚ETH和860枚XAUT转移至Wintermute

ZeroLend已开放空投代币申领

ApeCoin DAO已通过「由APE提供支持的NFT Launchpad」提案

Swell Layer 2总存款量突破9亿美元

南京检察院披露案例：安全公司盗取比特币并行贿公安人员

LayerZero CEO：「女巫自我报告」并非针对个人用户，而是针对大型女巫猎人

学者普遍认同比特币等数字货币具有财产属性

视频

符文协议热度飙升，高昂gas费或助长铭文复兴？

加密市场风起云涌！布局web3市场，贝莱德崭露锋芒！

Saga：多元宇宙中的模块化、一键发链、再质押的完美结合

Maximum Likelihood Estimation（MLE） 极大似然估计

基本原理

离散型概率分布

连续型概率分布

参考文献

快讯

视频

Maximum Likelihood Estimation（MLE）极大似然估计