【CS1导引篇】Actuarial Statistics
-
IFoA 英国精算师考试 CS1 概率论与数理统计的学习大纲,备考必看。各章的主干知识点和考点总结。
概述
IFoA在2019年新大纲考试改革后,各门课都发生了一定的变化。尤其是CS1(原CT3+部分CT6),CS2(原CT4+CT6),CM1(原CT1+CT5+少量CT4),CM2(原CT8)这四门,更是增加了 Paper B:机考部分。其中,CM1和CM2的机考部分为 EXCEL,CS1和CS2的机考部分为 R,均占30%的考试分值。
新大纲考试下的CS1如何复习?看原先的《【CT3导引篇】CT3 Probability and Statistics 概率论与数理统计》就不太够用了,所以本篇推文邀请了参加新体系CS1考试的于霍霍同学为大家做个介绍。
划重点:本公众号的文章中,标题为“导引篇”的推文代表强烈推荐,考前必备!
CS1A 纸考
Chapter 1 Random variables and distributions 随机变量和分布
第一部分就是全书的基础内容,后面的所有章节都离不开这一章。介绍了什么是随机变量以及各种分布(包括后面统计部分的卡方分布、t分布和F分布等),各分布的信息(分布函数、密度、各阶矩等)在yellow book上都有,所以不需要都记下来,但还是尽量熟悉。另外新增了各分布在R语言中的实现,在后面的机考中使用的频率比较高,可以重点关注下。
Chapter 2 Generating functions 母函数
包括概率母函数(PGF)、矩母函数(MGF)和积累量母函数(CGF),首先明确概念,然后知道怎么用PGF看概率、用MGF(以及CGF)求各阶矩就行。
Chapter 3 Joint distributions & Chapter 4 Conditional expectation 联合分布和条件期望
这两部分一般会相伴出现,基本每年都会考一道大题,建议重点关注。容易考的点包括边际分布、条件分布、条件期望,这几个部分可以着重练习下。另外随机变量和的方差、协方差的性质、随机向量函数的分布(包括卷积公式)也最好熟悉下。
Chapter 5 The Central Limit Theorem 中心极限定理
这一部分是后面统计部分的理论基础,明确定义、理解大概思想就行。另外会涉及到用R语言生成随机样本以及绘图,Core Reading上的代码很清楚,照葫芦画瓢练习即可。
Chapter 6 Exploratory Data Analysis
这一部分和R语言的联系比较紧密。首先是相关性分析,介绍了三种相关系数以及怎么用R语言求。之后是主成分分析,这一部分主要还是出现在机考中,熟悉代码,知道怎么看结果就行了。
Chapter 7 Random sampling and sampling distribution 随机样本和样本分布
数理统计部分的第一章。介绍了什么是样本,以及样本均值、样本方差等等的分布,这些是之后学习的基础,熟悉即可。
Chapter 8 Estimation and estimators 估计和估计量
这一部分在考题中的占比比较大,建议重点关注。首先需要掌握两个重要的参数估计方法——点估计和极大似然估计,这两点每次考试都会考,尤其着重看下极大似然估计,包括计算过程以及极大似然估计量的分布(CRLB求方差)。
还有一部分是估计量的评价标准,包括无偏性(Unbiasedness)、误差(Bias)、均方误差(MSE),这一部分知道怎么求就行。
最后新增了一个bootstrap method。这部分和机考联系更紧密,大概了解下基本思路,重点放在R语言的实现上即可。
Chapter 9 Confidence intervals 置信区间
置信区间这一部分书中会涉及一些比较少见的内容,包括二项分布和泊松分布的置信区间求法、比例的置信区间和paired data的置信区间。这些知识点是之前数理统计的学习中没怎么涉及到的(也有可能是我没好好听讲),第一次遇到会比较生疏,需要着重注意一下。在考试中,比例的置信区间考核频率比较高,其他几个知识点也偶有涉及。
Chapter 10 Hypothesis testing 假设检验
假设检验重在理解,和置信区间部分一样,比例的假设检验是较少见且考频较高的知识点。另外建议重点注意的内容包括:单侧检验时假设的设定、样本量的确定、分布拟合检验和Contingency table.
Chapter 11 Linear regression 线性回归
线性回归是整个考试中占比较大的部分,一般会在一整道大题中进行全面的考察,建议熟练地掌握各知识点。模型设定、最小二乘法估计参数、以及 σ^2 、β 的估计和E(Y|x)和Y(x)的估计、还有R^2的计算等等知识点都有可能涉及,复习的时候可以花些时间多过几遍。多元回归考的很少。
新体系下ANOVA也并入了线性回归这一章,ANOVA之前同样是在考试中占比较大的部分,但在新的core reading里,ANOVA的内容精简了很多,这两次CS1的考试也都没怎么考。ANOVA主要是对模型的理解,复习的时候还是建议做两道AVOVA的题,可以把重点放到线性回归中的ANOVA。
下面是新章节(原属CT6部分内容):
Chapter 12 Generalised linear models (GLM) 广义线性模型
从GLM开始,就都是之前CT6的内容了。GLM包括三部分内容:变量分布、线性解释量和连接函数。重点关注指数族分布,尤其是要熟悉各分布 b(θ) (也就是连接函数)的形式,以及均值方差的求法。
Chapter 13 Bayesian statistics 贝叶斯统计
近两次考试都会有一道贝叶斯统计的大题,占比很高,建议重点关注。主要还是对贝叶斯公式的理解,同时也需要对gamma分布和beta分布比较熟悉,基本上这一部分的题绕来绕去就是这两个分布,同时注意和后面的信度理论的结合。
Chapter 14 Credibility theory 信度理论
信度理论的前一部分和贝叶斯统计结合考察比较多,求完后验分布之后经常会让你写成信度形式,做两道题就ok了。
后半部分的EBCT1/2内容比较繁杂,首先最好还是有一个对模型基本的理解,不建议直接套公式。公式没必要背,yellow book上都有,但还是要熟悉一下,最好能做两道题练习一下熟练度。
计算器和公式书
CS1A(纸考)需要用到的计算器为科学计算器,推荐用 TI-30XS,某宝有售,可以带进考场。
纸考的考场上会发 yellow book(Formulae-and-Tables(俗称小黄书)),许多概率分布,各阶矩和部分基础公式都可以在上面直接查到,省去了背诵的麻烦。最好在备考阶段就提前熟悉一下。
CS1B 机考
机考是CS1新增的部分,内容是R语言。R语言各个考点的代码都会在core reading里展示出来,内容比较基础。没有用过R的同学可以花一点时间熟悉下R的基本操作,包括基础语法(输入数据、数据运算等)还有怎么导入csv文件等等。
考试不会涉及什么编程的内容,难度也都不太大,只要把书上有的代码打两遍就ok了。重点掌握线性回归和GLM,尤其是GLM的R语言部分,每次机考这两部分占比都能达到35%到40%。要知道这部分的代码以及怎么看结果,包括参数估计值、p值、R^2、AIC等等。
另外需要关注下置信区间里面的bootstrap method部分,其他知识点不会过于集中的考察,但大多都会涉及到,考题也都会比较基础,还是只要把书上有的代码看两遍就不会有什么问题了。考前主要看看这两次的机考真题,关注下重点问题就可以了!