擅长:python、mysql、java
<p>如果进行最大似然计算,则需要采取的第一步是:假设一个依赖于某些参数的分布。因为你的数据(你甚至知道你的参数),你“告诉”你的程序假设高斯分布。但是,你不告诉你的程序你的参数(0和1),但你让他们未知的先验和计算之后。</p>
<p>现在,你有了样本向量(我们称之为<code>x</code>,它的元素是<code>x[0]</code>到<code>x[100]</code>),你必须处理它。为此,您必须计算以下(<code>f</code>表示<a href="http://en.wikipedia.org/wiki/Normal_distribution#Probability_density_function" rel="nofollow noreferrer">probability density function of the Gaussian distribution</a>):</p>
<pre><code>f(x[0]) * ... * f(x[100])
</code></pre>
<p>正如您在我的给定链接中看到的,<code>f</code>使用两个参数(希腊字母μ和σ)。<em>现在必须计算μ和σ的值,使<code>f(x[0]) * ... * f(x[100])</code>取最大可能值。</p>
<p>完成此操作后,μ是平均值的最大似然值,σ是标准差的最大似然值。</p>
<p>请注意,我没有明确告诉您如何计算μ和σ的值,因为这是一个非常数学的过程,我手头没有(可能我也不理解);我只是告诉您获取值的技术,它也可以应用于任何其他分布。</p>
<p>因为你想最大化原始术语,你可以“简单地”最大化原始术语的对数-这就避免了你处理所有这些产品,并将原始术语转换成一些和的和。</p>
<p>如果你真的想计算它,你可以做一些简化,导致以下的术语(希望我没有搞砸任何事情):</p>
<p><a href="https://i.stack.imgur.com/Ng3fO.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/Ng3fO.png" alt="enter image description here"/></a></p>
<p>现在,您必须找到μ和σ的值,以便上面的野兽是最大的。这是一个非常重要的任务,称为非线性优化。</p>
<p>可以尝试的一个简化是:修复一个参数并尝试计算另一个参数。这样可以避免同时处理两个变量。</p>