【CT3导引篇】CT3 Probability and Statistics 概率论与数理统计
-
IFoA 英国精算师考试 CT3 概率论与数理统计的学习大纲,备考必看。各章的主干知识点和考点总结。
导言
说到概率论,就不得不提到爱因斯坦跟玻尔那场著名的争论:上帝掷骰子吗?
从概率论的角度讲,上帝每时每刻都在掷骰子。因此,整个宇宙,都是测不准的。
电影《春娇救志明》里,和志明分手以后的春娇内心很挣扎,于是她问外星人自己该不该和志明分手。外星人回答,“经过两兆亿次运算,我们得出结论,就是你们这段关系,一半机会可能成功,一半机会可能不成功。”“在这个宇宙间,大部分的事情都可以预测,只有你们地球人的感情,最难捉摸。”
也不能怪外星人数学差,谁让感情这种事有那么多的可能性呢。
《春娇救志明》的最后,志明等回了他的春娇。但在现实世界里,我们可能就会提出这样的疑问:1000个志明里面,究竟有多少个能等回他的春娇?
给定一个特定的志明,我们无法准确的判断他是否能等回春娇。但是我们可以通过经验数据(或者说样本数据)推断总体(例如1000个志明)的概率分布,进而得出我们想要的结论。在上述这个例子里,我们可以假定“志明等回春娇”这一事件服从二项分布,然后抽取100个志明的样本,用样本的二项分布的参数估计总体的参数。
CT3就是这样一门课——教你如何运用过去的经验数据,通过概率论和统计学的知识,来预测未来的种种可能性。通俗点讲,给你一张过去的CD,听听那时我们的爱情~哦不对,是让你把将来的爱情也给听出来。没错,这就是精算师们很重要的一部分工作。
接下来,正式开始介绍CT3。
CT3大纲
CT3包含概率论和统计学两块内容。这里不做细分,提出来只是告诉大家,在选修课程时可以同时选这两门。
CT3共有14章,以下为详细介绍:
第一章 Summarising data(统计数据)
大概占7%的分值。主要内容是数据的分类,频数。分组频数分布,累计频数分布表,茎叶图,散点图,直方图,集中趋势的度量(样本均值,中位数,众数),离中趋势的度量(样本标准差,矩,极差,分位数),对称性和偏度。这里要重点关注的是矩(moments)的概念的引入,后续的学习也会用到。一阶矩即均值(期望),二阶中心距即方差,三阶中心距即偏度。
第二章 Probability(概率)
大概占4%的分值。集合理论,Venn图,概率的基本运算法则,条件概率,全概率公式和贝叶斯公式。
第三章 Random variables(随机变量)
大概占4%的分值。离散型随机变量和连续型随机变量的期望,方差,矩的计算公式。
第四章 Probability distributions(概率分布)
大概占5%的分值。几种重要的离散型概率分布和连续型概率分布,它们的期望,方差在Formulae-and-Tables(俗称小黄书)里都可以找到。无需背诵这些公式,考试的时候直接查阅小黄书即可。提一下,这里有个很重要的性质:泊松过程的等待时间服从指数分布。
第五章 Generating functions(母函数)
很少直接考察本章内容。母函数包括矩量母函数(moment generating function,简称MGF),累计量母函数(cumulant generating function,简称CGF),概率母函数(probability generating function,简称PGF)。母函数使得矩的推导变得更加简单。
第六章 Joint distributions(联合分布)
大概占3%的分值。两个变量的函数的期望和方差的计算公式,协方差,相关系数,卷积公式,随机变量线性组合的矩,通过母函数推导随机变量的线性组合的分布,例如伯努利分布的加总服从二项分布,几何分布的加总服从负二项分布,等等。
第七章 Conditional expectation(条件期望)
大概占7%的分值。会直接考察本章的内容。本章的公式需要自行记忆,小黄书里没有。这一章还介绍了复合分布,在CT6非寿险精算当中会继续深入学习。
第八章 The Central Limit Theorem(中心极限定理)
大概占5%的分值。要着重掌握几种常见分布的正态近似,例如二项分布,泊松分布,卡方分布。当对离散型分布使用正态近似时,需要进行连续性校正。
第九章 Sampling and statistical inference(抽样和统计推断)
大概占3%的分值。样本均值,样本方差,总体均值,总体方差,T检验,F检验,抽样分布等。本章有时会以证明题的形式考察。
第十章 Point estimation(点估计)
大概占12%~20%的分值。矩估计,最大似然估计。再难一些会涉及到censored data和truncated data的处理。
第十一章 Confidence intervals(置信区间)
以下四章都是统计学里的核心内容,这里只提几个注意事项。注意单侧检验与双侧检验的区别。95%的分位数等要学会查小黄书。
第十二章 Hypothesis testing(假设检验)
大概占13.3%的分值。注意自由度的计算。
第十三章 Correlation and regression(相关和回归)
大概占13.5%的分值。相关分析和回归分析。所有相关的公式都可以在小黄书中查到,因此要重点理解它的思路而不是为背诵而记忆公式。看到Predicted mean response和individual response的时候,注意两者的区别。
第十四章 Analysis of variance(方差分析)
要熟练掌握方差分析表。
CT3全书的概念不太难。个别细节或者说扩展的部分会有些难,需要掌握其原理。第一遍看的时候理解不了也不用太紧张,尽管继续看下去,不会影响整个知识体系的把握。在考试的时候,掌握了主干部分就没什么大问题了。不过话说回来,当你看完整本Combined Materials Pack,你会发现,CT3的理论还是很有意思的呢。
PS:CT3要准备好科学计算器和小黄书噢。
写在结尾的话
人生是一个多面体,它有千万种状态,难以捉摸。它时而冷酷,时而温柔,它能让你对着手机屏幕哧哧的傻笑,也能让你茶饭不思夜不能寐。
令人有些失望的是,即便我有一百多张过去的CD,即便我知道人生每种状态的概率分布,我仍然无法预测发生在某个特定个体(比如我自己)身上的会是哪一类事件。无论好的坏的,我想得到的想不到的事情,都不与概率论和统计学的原理相悖。
当然了,人生充满种种可能性也未必是件坏事。
朝着你认为最好的状态去努力,让美好的人生状态变成众数,让那些不那么好的事情零星分布在尾部,这样,就很好。