【CT3系列】MGF 矩量母函数:和 My Girlfriend 缩写一样的函数
-
导语
看了上一篇《恋爱险的起源》的朋友们应该都了解MGF这个梗了。没看过上一篇,真的以为MGF是My Girlfriend才点进来看的同学,请自行面壁思过,不好好考精算证,想什么女朋友(手动doge)。
进入正题。MGF的全称是Moment Generating Function,即矩量母函数。在统计学中,矩又被称为动差(moment)。因此,矩量母函数(Moment Generating Function,简称MGF)又被称为动差生成函数。MGF是IFoA CT3第五章的内容。
定义
首先,我们引入MGF的定义。
随机变量 $X$ 的矩量母函数 $M_{X} (t)$ 对所有存在期望值的 $t$ 定义为:
$$
M_{X} (t)=E[ e^{tX} ]
$$
我们知道,期望的公式为
$$
E[ g(x)]=\left{
\begin{array}{l}
\sum\limits_{x}^{}g(x)P(X=x) ,若X离散 \
\int\nolimits_{\text{-} \infty }^{\infty }g(x)f_{X} (x)dx,若X连续
\end{array}
\right.
$$
因此,可以推出MGF的公式为
$$M_{X} (t)=E[ e^{tX} ]=\left{
\begin{array}{l}
\sum\limits_{x}^{}e^{tx} P(X=x) ,若X离散 \
\int\nolimits_{\text{-} \infty }^{\infty }e^{tx} f_{X} (x)dx,若X连续
\end{array}
\right. $$随机变量的所有矩能由矩量母函数相继求微分得到
我们把 $M_{X} (t)$ 称为矩量母函数,因为 $X$ 的所有矩能由 $M_{X} (t)$ 相继求微分得到。例如:
$$
M_{X} ^{'} (t)=\frac{d}{dt} E[ e^{tX} ]=E[ \frac{d}{dt} (e^{tX} )]=E[ Xe^{tX} ]
$$
因此,
$$M_{X} ^{'} (0)=E[ X]$$
类似地,
$$M_{X} ^{''} (t)=\frac{d}{dt} M_{X} ^{'} (t)=\frac{d}{dt} E[ Xe^{tX} ]=E[ \frac{d}{dt} (Xe^{tX} )]=E[ X^{2} e^{tX} ]$$
所以,
$$M_{X} ^{''} (0)=E[ X^{2} ]$$
一般地,$M_{X} (t)$ 的 $n$ 阶导数在 $t=0$ 时等于 $E[ X^{n} ]$,也就是说,
$M_{X} ^{(n)} (0)=E[ X^{n} ],n\geq 1$我们换种方法再证明一次:
首先将 $M_{X} (t)$ 各项根据泰勒级数展开:
$$
\begin{array}{l}
M_{X} (t)=E(e^{tX} )=E(1+tX+\frac{t^{2} }{2!} X^{2} +\frac{t^{3} }{3!} X^{3} +...) \
=1+tE[ X]+\frac{t^{2} }{2!} E[ X^{2} ]+\frac{t^{3} }{3!} E[ X^{3} ]+...\end{array}
$$
在 $M_{X} (t)$ 的展开式中,第 $r$ 项为 $\frac{t^{r} }{r!} E[ X^{r} ]$
对 $M_{X} (t)$ 求一阶导:
$$M_{X} ^{'} (t)=E[ X]+tE[ X^{2} ]+\frac{t^{2} }{2!} E[ X^{3} ]+...$$
所以,
$$M_{X} ^{'} (0)=E[ X]$$对 $M_{X} (t)$ 求二阶导:
$$M_{X} ^{''} (t)=E[ X^{2} ]+tE[ X^{3} ]+...$$
所以,
$$M_{X} ^{''} (0)=E[ X^{2} ]$$计算特定分布的矩量母函数
接下来,我们以泊松分布为例,介绍如何计算特定分布的矩量母函数。
已知 $X\sim poi(\lambda )$,那么
$$
\begin{array}{l}
M_{X} (t)=E[ e^{tX} ] \
=\sum\limits_{}^{}e^{tX} P(X=x) \
=\sum\limits_{}^{}e^{tx} \frac{\lambda ^{x} }{x!} e^{-\lambda } \
=e^{-\lambda } \sum\limits_{}^{}\frac{(\lambda e^{t} )^{x} }{x!} \
=e^{-\lambda } e^{\lambda e^{t} } \
=e^{\lambda (e^{t} -1)} \end{array}
$$
考试中可能会出现这种题型,但如果题目中没有特别的要求,我们无需背诵每个分布对应的矩量母函数。直接查找公式书即可。两个重要性质
矩量母函数的一个重要性质是,独立随机变量和的矩量母函数正是单个矩量母函数的乘积。
为了理解这一点,假设$X$和$Y$是独立的,它们分别有矩量母函数 $M_{X} (t)$ 和$M_{Y} (t)$,那么 $X+Y$ 的矩量母函数 $M_{X+Y} (t)$ 是:
$$M_{X+Y} (t)=E[ e^{t(X+Y)} ]=E[ e^{tX} e^{tY} ]=E[ e^{tX} ]E[ e^{tY} ]=M_{X} (t)M_{Y} (t)$$
矩量母函数的另一个重要性质是,矩量母函数唯一地确定了分布。这就是说,在随机变量的矩量母函数和分布函数之间存在一一对应关系。
这个性质的一个重要应用是,如果两种概率分布的MGF相同,那么他们的概率密度函数(概率分布也相同)。因此,只要推导出复合函数的MGF的表达式,就可以知道复合函数的概率分布。
这样说可能还有点抽象,不要着急,我们来举例说明。
例:如果 $X$ 和 $Y$ 分别是以 $(n,p)$ 和 $(m,p)$ 为参数的独立二项随机变量,那么 $X+Y$ 的分布是什么?
解:
$X+Y$ 的矩量母函数为:
$$M_{X+Y} (t)=M_{X} (t)M_{Y} (t)=(pe^{t} +1-p)^{n} (pe^{t} +1-p)^{m} =(pe^{t} +1-p)^{n+m} $$
而 $(pe^{t} +1-p)^{n+m}$ 正是以 $(n+m,p)$ 为参数的二项随机变量的矩量母函数,从而它一定是 $X+Y$ 的分布。即是说,$X+Y$ 的分布为以 $(n+m,p)$ 为参数的二项分布。总结
可以说,MGF概念的引入让CT3变得生动起来。通过MGF,我们可以很方便地推导概率分布的种种性质,而无需重复地使用积分求解。矩的推导,独立随机变量线性组合的概率分布,复合分布的性质,都因为MGF的引入变得非常简单。
如果你很遗憾地想,自己不仅没有Girlfriend,连矩量母函数都看不懂,那该怎么办呢?没关系,除了MGF以外,母函数还包括累计量母函数(cumulant generating function,简称CGF),概率母函数(probability generating function,简称PGF)。它们都使得矩的推导变得相当便捷。CGF,PGF,MGF,看懂其中一种,其余两种自然就懂了。
CGF,MGF和PGF之间存在一些对应关系,比如,CGF是MGF的对数;而将PGF中的$t$换成$e^{t} $,即可得到MGF。三者原理相似,这里不再赘述,请自行参阅教材。思考题
用MGF的相关知识证明以下结论:
如果随机变量$X$服从参数为$(\alpha ,\lambda )$的伽马分布,那么$2\lambda X$服从自由度为$2\alpha $的卡方分布。
{% raw %}
<details>
<summary>
证明:
</summary>
{% endraw %}查表可知,伽马分布的矩量母函数
$$M_{X} (t)=(1-\frac{1}{\lambda} )^{-\alpha } $$
当 $Y=a+bX$,
$$M_{Y} (t)=E[ e^{tY} ]=E[ e^{t(a+bX)} ]=e^{at} E[ e^{btX} ]=e^{at} M_{X} (bt)$$
这里,$a=0$,$b=2\lambda $,所以:
$$M_{Y} (t)=M_{X} (2\lambda t)=(1-\frac{2\lambda t}{\lambda } )^{-\alpha } =(1-2t)^{-\alpha } $$
这正是自由度为 $2 \alpha $ 的卡方分布的矩量母函数。
因此,$2\lambda X$ 服从自由度为 $2\alpha $ 的卡方分布。{% raw %}</details>{% endraw %}