【SP8导引篇】General Insurance Pricing



  • IFoA 英国精算师考试 SP8 General Insurance Pricing 学习大纲,备考必看。各章的主干知识点和考点总结。

    本文作者的自我介绍:

    我是Mengkelyu,也可以叫我珂珂。现在是卡斯商学院精算管理的研究生。

    喜欢唱,跳,rap,研究精算和代码。思维跳跃,爱好和平,喜欢猫猫,支持少数群体权益。

    和Jackie从0学起搭建了论坛和服务器。常年论坛在线解答关于数据科学,R, VBA等的相关问题。

    九月毕业,希望能有HR小哥哥小姐姐pick我。

    导言

    常言道,学而不思则罔,思而不学则殆。学习精算的高级课程,给我最大的感触就是:不仅仅要会做精算模型,而且要明白自己“在做什么”,为什么要这么做,有什么优缺点和局限性。因此,此导引篇致力于用平白的语言,简略讲述SP8的内容以及背后原理。文章内容如有任何不妥当之处,欢迎指出。

    SP8是非寿险方向定价。本导引篇依据Pietro先生的教材编写。主要内容为书上原本的内容+我自己的理解。Pricing in general insurance可以在IFoA图书馆找到。本篇介绍内容以英国保险市场为基准,不同国家可能有不同实践标准。

    适合观众:已经有CS2(旧大纲下CT6)基础,打算备考SP8的同学。

    文末有参考书链接。

    保险和再保险产品

    各个保险产品有不同的特性,因而精算师需要针对不同的特点来定价。
    这些特性主要体现在几方面:

    • 数据的丰富程度。一般来说,个人险(Personal lines)数据量较大,而商业险(commercial lines)数据量较小。当数据量小的时候,定价时就需要做一些特殊处理。比如利用市场数据的exposure rating, 比如利用credibility theory来结合客户数据和市场数据,再比如仅用市场数据进行尾部的模拟。

    • 是否能迅速报案结案。这决定了定价过程中要如何处理已经发生,但还没有告诉保险人,或者已经报案,还没有结案的claim。一般人身伤害事故(bodily injury)有着报案和结案花费时间更长的特点——被保险人可能需要求医,问医,花费很久才能知道自己的身体究竟出了什么问题,要花多少钱解决。

    • 损失是否有上限。财产保险损失的上限一般是它本身的市场价值,而责任保险损失一般来讲是没有自然上限的。

    • 频率和强度特性。大多数财产险频率高损失低。

    • 是否存在systemic risk。

    答题的时候需要注意两个概念:一个是systematic risk 一个是systemic risk.两者拼写相似,意义却有很大不同。

    以下解释来源于Investopedia

    Systemic risk describes an event that can spark a major collapse in a specific industry or the broader economy.

    比如08年金融危机,一连串金融机构的倒闭就是systemic risk的一个例子。在SP8中往往指受灾难性事件影响的险种。比如采矿业的Employer liability。一次矿难会产生非常高的损失。

    Systematic risk is often used interchangeably with "market risk" and means the danger that is baked into the overall market that can't be resolved by diversifying your portfolio or holdings.

    Systematic risk是一个市场概念,不仅仅局限于某一事件。
    当买某种asset的时候,价格波动性分成两种,一种是可以通过分散投资减少的波动性,一种是无法分散掉的波动性。Systematic risk就是无法通过diversification分散掉的风险。

    SP8这门课中往往我们用到的是Systemic risk。

    保险结构

    个人险(Personal lines),商业险(commercial lines), 和再保(reinsurance)分别有不同的保险结构。

    个人险

    一般来说个人险有一个免赔额(excess / deductible),有一个限额(limit).
    保险人赔偿高于免赔额的损失,同时赔款总数不得高于限额。

    商业险

    商业险由于保险期间内可能有超过一次损失,所以有更多的参数来告诉你什么赔什么不赔(coverage modifier)。

    主要介绍以下四个:

    • Each and every loss deductible (EEL)

    • Annual aggregate deductible (AAD)

    • Limit (L)

    • Aggregate limit (AL)

    EEL和L比较好理解,就是对于每次损失的免赔额和限额。

    但是被保险人仍然面对风险:如果发生损失的次数太多,但是每次又没能超过免赔额,我是不是会遭受很大损失呢?

    因此,AAD就帮助被保险人解决了这一难题。当损失的免赔额累积到了一定数额后,保险损失就不需要考虑免赔的限制了。

    而AL呢,从保险人的角度来讲,他们希望保险期间内的损失可以有一个上限。AL就是整个保险期间内的累计保险限额。

    非比例再保险Risk excess of loss

    Risk excess loss保单有两个非常重要的概念

    Reinstatement

    Reinstatement 规定了再保险公司最多能赔多少次赔款。
    比如对于 $3m,,,xs,,,2m$ (免赔额是2m,限额是3m)的保单,一次损失把$3m$的限额用光后,交了保费可以给限额”充值“,下一次还可以继续赔偿。

    如果$3m,,,xs,,,2m$的保单有4个reinstatements,这个保单可以充值四次。加上最初的限额,再保险公司最高赔付额为$3m \times (4+1)$

    Indexation clause

    保险公司在年初买了再保险,等到损失发生的时候,往往损失额会受到通胀(inflation)的影响。因此,保险公司不得不提前做好规划,买比需求更高的限额和免赔额。

    为了应对这一问题,再保险公司推出了根据通胀改变限额和免赔的产品。

    那么如何确定通胀的程度呢?一般方法是根据某个指数。AWE (average weekly earnings index)是最常见的指数。

    指数条款又分为full index clause和severe inflation clause,这里暂且不做展开。

    考试需要会计算再不同指数条款下保险公司的赔付额。

    非比例再保险Aggregate excess of loss

    和刚刚介绍的Risk excess of loss 很像,但是这个保险是针对某一事件带来的总损失的。

    比如说,一次森林大火,烧毁了很多房屋。虽然每个房屋的损失不高,但是加起来就是不小的损失了。Aggregate excess of loss就是用来解决这种情况的。

    非比例再保险Catastrophe excess of loss

    Cat XL和Aggregate XL很像,但是损失免赔额更高。主要是针对于巨灾设计的。

    Hours clause

    很多Cat XL的再保险都有Hours clause,即是再保赔偿发生在一定时间内的损失。然而这个时间窗口什么时候开始可以由被保险人决定。
    被保险人可以选择对他最有利的时间窗口。

    比例再保险Quota share

    Quota share常常令人疑惑:它不一定能减小保险公司理赔的波动性。所以很多人感到困惑,quota share不就是保险公司把自己的业务分出去了吗?

    其实不然,我们需要把保险公司手上有多少资本纳入考虑范围。因为资本是有限的,保险公司往往只能承包一定数量的保单。

    保险公司面对的选择可能是要么不选择再保险,承保一个保额为5m的保单,要么选择分出50%,承保两个保额为5m的保单。保险公司当然愿意选择后者,因为同样的期望损失,风险减小了。

    比例再保险Surplus

    在Quota share保单中,不管对于风险大的保单还是风险小的保单,再保险公司都承保相同的比例。然而,保险公司往往希望再保险公司能多承保一些风险大的保单,从而Surplus就诞生了。需要注意的是,Surplus仍然是比例再保险的一种,只是分出的比例更加灵活。保险公司可以在一定范围内选择自留额。

    为了计算再保险公司承保的风险,一般需要以下几个参数:

    • 最大自留金额 $R_{max}$ = maximum retention (monetary value)

    • 最小自留金额 $R_{min}$= min retention

    • 保障单位(lines of cover):分出额 / 自留额。

    • 最大保障单位 $L$ = maximum number of lines of cover 这个概念稍微比较难理解。它就是用来表达最大分出额的一个工具。比如保险公司选择自留r(r>=$R_{min}$; r<=$R_{max}$), 再保险公司最高分出金额就是 $r \times L$

    举个栗子

    阿明保险公司和阿珂再保险签订了Surplus合约。合约规定最大自留额是20w,最小自留额是5w,最大保障单位是10。阿明保险公司承保了一个保单,这个保单正好在合约范围内,于是阿明按照合约把这个保单分给了阿珂。

    阿明评估了一下,这个保单最大可能损失为100w,经过商议,在5w和20w的可能范围之间,他们决定自留10w。所以他们需要转移给再保 100 - 10 = 90w。用保障单位来表达就是 90w/10w = 9个保障单位。9小于合约规定的最大保障单位10,阿明很开心,这说明这个保单可以被全保。

    没想到几天后,保单发生了5w的损失。

    阿明可以从阿珂那里得到多少赔偿呢?

    因为5w小于自留额10w,所以阿珂不赔——这是错误的计算方法,别忘了Surplus是比例再保险。

    正确的计算方法是不论损失发生大小,自留额和分出额都是按照1:保障单位进行计算。这个例子里面是1:9。

    那么到底该如何计算呢?知道答案的大家可以留言回复哦。

    两个风险模型

    非寿险最常见的两个风险模型是individual loss model和collective risk model。

    这两个风险模型在CS2(旧大纲下CT6)中有涉及,SP8更偏模型实践部分。这一部分需要掌握:

    • 模型假设。给出某种产品,需要能够说明哪种假设不满足。

    • 基础计算:均值,方差等

    • Collective risk model中计算Aggregate loss distribution的三种方法及其优缺点。

    • 会描述simulation的过程。

    Individual loss model

    假设

    • There is a finite number 𝑛 of risks

    • Only one loss is possible for each risk j, and this happens with given probability $𝑝_𝑗(𝑗=1,…𝑛)$

    • The loss events are independent –i.e., the fact that a given risk has a loss does not have an impact on whether or not another risk has a loss

    • The severities are independent but they are not necessarily identically distributed

    一年的总损失为
    $S=X_1+X_2+...+X_n$

    Collective risk model

    假设

    • 𝑁 is a discrete random variable (rv) with distribution $𝐹_𝑁$

    • The loss amounts X are independent, identically distributed (iid) rvswith common distribution $F_X$

    • 𝑁 and the 𝑋’s are independent

    常用公式如下:

    $$E(S)=E(N)E(X)$$

    $$Var(S)=Var(X)E(N)+E(X)^2Var(N)$$

    描述simulation

    描述一个过程往往不是很难,但是很多人却感到无从下手。这里是一个手把手指南:

    • 第一步是描述从分布中抽取随机数

      • Pick a random number n(k) from a Poisson distribution with rate 𝜆
      • generating a large number, say 100,000, of simulated years of losses
      • Sample a number of losses in a given year from the ... distribution
    • 第二步是描述重复多次某个过程

      • Move to the next simulation (k← k+1) and repeat (1) to (4) for a large number of simulations, e.g. 100,000

      • generating a large number, say 100,000, of simulated years of losses

      • Repeat this procedure for i=1,…N where N is a large number

    • 第三步是描述如何得到你想要的统计量

      • 得到中位数/众数/平均数:We can get the average by taking the median / mode / mean of all the simulated loss

      • 得到分位数: we sort all the S(k) in ascending order, thus obtaining an empirical total loss distribution. The nth percentile can be calculated by picking the nth percentile in such a sorted list, e.g. if there are 100,000 elements, the nth percentile will be roughly element $100,000 \times n$

    数据准备

    定价的时候,我们常常需要通过过去的理赔数据来判断保险期间会发生多少理赔。做这种判断之前,我们常常需要对保险数据进行处理。处理的核心在于:假设过去发生的风险事件在今天发生了,那么会给我们带来多少损失呢?

    比方说,去年珂珂家有三亩地,遭遇了蝗灾,遭受一百万的损失。今年珂珂又买了三亩地,一共六亩,如果同样遭受蝗灾,直觉上讲肯定受到的损失就要翻倍了。这就是根据risk exposure对损失进行调整的原因。

    再比方说,去年珂珂家有三亩地,花了一百万买稻田苗,遭遇了蝗灾,损失了一百万。今年稻田苗价格涨了,珂珂要花两百万才能买好稻田苗,那么如果再次遭遇蝗灾,受到的损失就和原来不一样了。这就是根据inflation进行调整的原因。

    设定inflation假设

    在处理Inflation影响的时候,一个问题是:该用什么作为基准呢?一篮子价格指数往往不能反映claim inflation。你还需要仔细研究这个“篮子”里面究竟有什么。

    比如说一线城市房价的Inflation和工资的inflation就完全不一样。说起来都是泪。了解三种方法:

    • Statistical estimates of claim inflation using robust statistics

    • Basket Method

    • Statistical approach to large loss inflation

    Burning Cost Analysis

    BCL通俗的说就是处理数据后求平均损失的过程。它没有把理赔的Frequency和Severity分开。需要掌握:

    • 计算

    • 假设

    • 不确定性

    计算分为以下几步:

    1. 对损失根据inflation大小进行再估值。并且计算分出和自留损失。
    2. 把损失分配到各个保单年度。
    3. 根据今年的risk exposure调整损失。注意分子是今年的exposure,分母是损失年的exposure.
    4. 调整IBNR和IBNER
    5. 调整大损失。这里的大损失是指比如在五年的数据中,出现了大概十年会出现一次的损失。这个损失要以一半来计入考量。
    6. 根据risk profile的变化来处理损失。比如说今年由于气候突然变化,火灾的风险变大了。一般题目中不要求考虑risk profile的变化。
    7. 把总限额和总自留额纳入考虑。
    8. 计算burning cost.就是计算调整后loss的平均或加权平均。

    处理IBNR

    Development triangle

    处理IBNR有两种方法。第一种是大家喜闻乐见的流量三角形(development triangle)。
    不过众所周知的是,流量三角形不适用于所有情况。首先它损失的信息太多了。几万条理赔数据,用几行sumif就能看出报案事件和事故发生时间之间的关系?正是因为这个原因,处理IBNR时往往需要加入不少主观判断。

    流量三角形(更适用于处理频率高,损失低,事故进展方式(development pattern)比较稳定的保险。面对别的险种,则很容易出错。

    需要掌握最后一个对角线缺失的几种处理方法。

    • Exclude incomplete diagonal

    • Gross up incomplete diagonal

    • Use a different time subdivision (e.g. 4m)

    • Shift the observation period

    Delay distribution

    更加现代的处理IBNR的方法是计算“拖延分布”(Delay distribution)。简单的说,就是对每个理赔计算报案时间和事故发生时间之间的差值,然后用model去拟合它。

    然而,这还是一个很新的方法,目前尚无统一标准。

    Frequency modelling

    拟合模型的时候,要注意不要陷入“过拟合”陷阱。尤其是当我们没有区分训练集和测试集的时候。要明白:追求拟合完美的曲线是没有意义的。重要的是是否能回答这个问题:这个模型对于未来有预测性吗?为什么?

    讲了三种模型

    • Poission

    • Negative Binomial

    • Binomial

    要了解每个模型的特点,以及计算参数的两个方法:最大似然估计(Maximum likelihood method)和矩估计(Method of moment)。

    掌握选择模型的方法

    不推荐但是考试中可以用的方法

    这三个模型最大的区别在于方差均值比 variance/mean (V/M) ratio。所以

    • 如果 V/M < 1 -> binomial

    • 如果 V/M = 1 -> poisson

    • 如果 V/M > 1 -> negtive binomial

    推荐的方法

    • 如果用的是Individual risk model, 而系统性风险(一个风险事件会引起大量损失)有限的话, 使用 binomial/multinomial distribution

    • 如果用的是collective risk model

      • 如果 V/M ≤1 用 Poisson

      • 如果 V/M > 1 那么用 negtive binomial 模型

    Severity modelling

    处理IBNER

    方法有:

    1. 不处理,用所有损失拟合Severity distribution
    2. 只用已经结案的损失拟合Severity distribution
    3. Murphy-McLennan method。使用类似于chain-ladder的方法计算。
    4. General linear model。找到影响IBNER的因素有哪些(比如sum assured),做非线性回归。

    了解各种方法的逻辑和优缺点。

    选择severity model

    Severity model面临的最大困难是拟合尾部。所以往往是要选择一个threshold, 比threshold更高的损失用一个分布来拟合,比threshold更低的损失用另一个分布来拟合。severity modelling往往分成三步:

    1. 选择合适的threshold
    2. 选择合适的尾部模型(往往用Generalized Pareto Distribution)
    3. 选择合适的模型拟合小的损失(往往用Lognormal,因为过往经验证实它的拟合程度比较好,或者用Empirical distribution)

    但是有人会问Empirical distribution不是会带来过拟合问题吗?

    支持Empirical distribution的理论表明,当数据足够大时,Empirical distribution会趋近于总体分布。

    如何在保费中考虑费用,资产回报率

    计算保费有五种方法,需要掌握的是“Cost Plus”。分成五步

    1. 计算期望损失。一般是模拟的加总损失分布(Aggregate loss distribution)的均值。
    2. 把不确定性纳入考虑。
      • 理赔波动性
      • 灾难性事故发生的可能性
      • 参数/模型/数据不确定性
    3. 加入费用。
      • 理赔费用,核保核赔费用等
      • 佣金
      • 再保险纯保费(注意是纯保费!再保险保费-再保险公司期望理赔)
    4. 减去收入。由于收到保费和做出理赔之间有时间差,保费的投资收入需要被纳入考虑。尤其对于一些较长期的非寿险。
    5. 加入预期利润。保单需要有盈利的空间。需要盈利多少往往取决于股东要求的回报率有多高。

    经过这五步,就可以得到technical premium了。

    然后考点来啦:为什么这不是保险公司最后会收取的保费呢?

    因为最终收取的保费事实上是一个纳入商业考虑的决策。比如说需要考虑监管要求,市场大小,这个产品和其它产品的关系等。

    保险公司的最终目标是长期成长和盈利。保费的制定会受到这些因素的制约。精算师则应该了解“正确的保费”是什么,为公司把控好风险。

    题目常常要求我们计算保费。公式如下

    $$TP=\frac{GRP+RI}{(1-exp%)(1-com%)(1-profit%)(1+r)^t}$$

    其中:

    • GRP: 总风险保费。需要加入和理赔成正比的费用(比如理赔费用),以及为应对不确定性加入的loading。

    • RI: 纯再保险保费。再保险保费-再保险公司期望理赔。

    • exp% 费用率。和保费成正比的费用,比如核保费用。

    • com% 佣金率。

    • Profit% 利润率。

    • r 预期投资回报率。

    • t 预期投资时间。

    计算资产成本

    基本概念

    • Regulatory capital:监管者认为保险公司需要持有的最低资本。

    • Economic capital:保险公司从经营的角度考虑,认为自己需要持有的最低资本。

    • Economic capital 必须要大于等于 Regulatory capital

    两个考点,一个是衡量风险的方法,另一个是资产分配的方法。

    衡量风险的方法

    这一部分也算是老生常谈啦,需要掌握各个risk measure的优缺点。大家还记得一致性(coherence)的四个条件是什么吗?

    资产分配的方法

    掌握两种方法

    • Proportional spread

    • Game theory

    非比例再保险 Experience rating

    用客户的数据计算期望损失,都算Experience rating的范畴。但是非比例再保险中,定价会遇到独特的挑战。

    为什么呢?因为保险公司报给再保险的数据不是完整的。免赔额以下的理赔往往不需要报给再保险公司。这里的免赔额也叫做Reporting threshold。只有损失高于这个额度的时候,保险公司才会告知再保。

    但是这就带来了一个问题:处理过去的理赔数据的时候,我们需要重新估值,也就是根据inflation来计算如果这些损失发生在今天,数额会是多大。重新估值后的数据就不是从Reporting threshold开始的了,而是从Reporting threshold经过inflation调整后的值开始的。

    这里就有了Analysis level的概念:我们只能通过过往的经验对超过某一程度的损失进行定价。Analysis level >= Reporting threshold.

    这里的考点是:如何通过Reporting threshold计算Analysis level。计算方式和再保险Basis息息相关。

    首先要了解三种再保险的Basis:

    • LOD:再保险公司赔偿保险期间内发生的损失

    • RAD:再保险公司赔偿保险期间内开始的保单发生的损失

    • Claims made:再保险公司赔偿保险期间内报案的损失

    对于LOD保险,公式如下

    $$AT \geq RT\times(1+r)^{RY-FY+\frac{1}{2}}$$

    对于RAD保险,公式如下

    $$AT \geq RT\times(1+r)^{RY-FY+1}$$

    这里:

    • AT=analysis threshold

    • RT=reporting threshold

    • r=claim inflation

    • RY=renewal year

    • FY=first year from which losses are available

    计算背后的原理是:一定要保证高于AT的损失记录是完整的。因此,虽然用每年的reporting threshold都能计算出一个analysis threshold来,我们只能取其中的最大值,也就是用数据里面最小的那一年算出来的值。

    得出AT之后,想要算出保费,要经过如下几步:

    • Frequency analysis

    • Severity analysis

    这两步和之前介绍的基本一样,需要注意的是再保险公司的exposure可以用直保保费。这里的考点是:如何处理保费,使得保费能够代表保险期间内的风险暴露(exposure)。

    • Payment and Settlement pattern analysis

    因为Index clause的存在,理赔发生后多久钱能赔付出去就显得至关重要。因此这里需要对Payment Settlement pattern单独建模。

    • 计算Aggregate loss to an excess layer

    • 从期望损失到Technical premium

    Exposure rating

    Exposure rating是针对财产保险的。
    当客户的数据不足以帮助保险公司定价的时候,保险公司就需要用行业数据来进行定价。Exposure rating就是帮助保险公司利用行业数据来进行定价的方法。

    需要掌握这里的计算题,重要公式:

    $$E(S_{D,L})=(G(d+l)-G(d))\times E(S)$$

    $$G(u)=\frac{E(min(x,u))}{E(x)}$$

    $$E(x)=\frac{1}{G'(0)}$$

    这里暂且不展开各个公式的含义。还需要掌握如何对整个portfolio计算特定保单下的期望损失。

    ILF

    ILF和exposure rating原理类似,只是这个是针对责任保险的。两者最大的区别在于财产保险有natural limit, 所以exposure rating可以用loss / MPL (Maximum possible loss) 来衡量表示。责任保险没有limit,所以ILF的单位是金额。

    需要掌握这里的计算题,重要公式:

    $$E(S_u)=ILF_B(u)\times E(S_b)$$

    $$ILF_B(u)=\frac{E(min(X,u))}{E(min(X,b))}$$

    Credibility

    数据量少的时候,通过客户数据计算的保费往往不确定性较高。如果用市场数据,问题在于市场数据不一定符合客户的实际情况。

    这时,精算师可以利用credibility theory信度理论来计算两个方法下算出结果的加权平均,使得最后的结论更加精确。

    $$\hat{\varphi}=Z\times\hat{\varphi_c}+(1-Z)\varphi_m$$

    $$Z=\frac{\sigma^2_h}{\sigma^2_h+se_c^2}$$

    • $\hat{\varphi}$ 是最终估计

    • $\hat{\varphi_c}$ 是用客户数据估计的结果

    • $\varphi_m$是从市场上得到的估计

    • Z可以看作客户数据估计的权重

    • $\sigma_h$是衡量市场估计可信度的指标。h代表heterogeneity

    • $se_c$是客户估计的标准误,是衡量客户数据估计可信度的指标。注意这里用的是标准误而不是标准差。

    Credibility theory的一个应用是把我们刚刚说到的experience rating和exposure rating得到的结果结合在一起。

    计算保费变化

    保险公司需要衡量一年到另一年保费的变化来监控定价过程。
    常用的术语/简写如下:

    • BP:实际保费

    • TP:Technical premium

    • PAI: 保费充足率,即BP/TP

    大家可能想:保费变化不就是第二年的BP除以第一年的BP吗?

    不是。因为两年的风险暴露可能不一样,物价指数可能不一样。比如说假设其它条件不变,去年承保的是1亩地,今年是两亩地。保费翻倍但是费率并没有变化。

    因此BP_asif的概念诞生了:假如去年和今年承保的风险没有变化,物价指数等都没有变化,那么为去年重新计算的保费就是BP_asif。

    费率变化为:第二年的BP/去年的BP_asif-1

    这一章需要掌握:

    • 计算某个保单的费率变化。并且能够把保费变化的原因分解出来。

    • 计算Portfolio的费率变化。

    • 计算并解释保费充足率。

    重要公式:

    $$BP_{asif}=\frac{TP'}{TP} \times BP$$

    这里BP指的是去年的实际保费。TP'是第二年的Technical premium,TP是去年的Technical premium. $$BP_{asif}$$是如上文解释的重新计算保费。

    计算Portfolio的费率变化过程如下:

    1. 如果Portfolio中哪个保单没有同时去年和今年都存在,剔除这些保单。
    2. 计算没有剔除保单的$BP_{asif}$。注意这里的$BP_{asif}$必须是按照分给保险人的份额确定的。题目有时会故意给出按照100%比例的$BP$。
    3. 加总所有的$BP_{asif}$
    4. 计算第二年的总$BP$/总的$BP_{asif}$-1

    GLM (General linear model)

    需要掌握:

    • 频率模型(Frequency model)和损失模型(Severity model)常用的模型有哪些。

    • 写出GLM的一般形式。

    • 会算degree of freedom / number of parameters

    • 会计算和解释AIC

      • $$AIC=-2logP + 2 \times \text{number of parameters}$$

      • $$\text{Number of parameters} = 1(\text{interception parameter}) +\text{additional parameters for} X + \text{number of dispersion parameters}$$

      • AIC比别的方法好的地方在于:别的方法可能会倾向于选择参数较多的模型。而AIC包含了"parameter penalty"。为什么选择参数较多的模型不好呢?因为参数多可能会有“过拟合问题”减低模型的预测能力。

    Typical frequency model

    Noise function Prior weight Link function number of dispersion parameters
    Poisson Exposure Ln(x)​ 0 for Poisson noise

    Typical Severity model

    Noise function Prior weight Link function number of dispersion parameters
    Gamma Number of claims Ln(x)​ 1 for gamma noise

    保险最优化

    需要计算每种保险方案的成本,并选择成本最低的方案

    Total cost of risk = Premium + Mean Retained + CoC x (VaR@RA– Mean Retained)

    在某个特定保险方案下

    • premium是缴纳的保费

    • Mean retained是损失自留额的期望值

    • CoC是资本成本

    • VaR@RA是自留损失的分位数。具体哪个分位数由不同的风险偏好程度决定。

    沟通不确定性

    注意考试常常问:考试某个过程中存在的不确定性有哪些?考试前建议过一遍各个模型的不确定性和假设。
    从这些角度来考虑

    • Process uncertainty:不管你的模型多么精确,发生损失的过程本身就是不确定的。

    • Parameter uncertainty:假如模型精确,对于参数的估计可能是不精确的。什么情况会加大参数不确定性呢?

      • 数据量少

      • 数据中有一些极端情况下的损失

      • IBNR计算中如果用了流量三角形,link ratio具有不确定性

    • Model uncertainty:模型本身可能是错的。

      • exposure rating中选错了exposure curve, 选错了swiss re curve的参数c,是模型错误的例子
    • Assumptions/data uncertainty:假设/数据可能不准确。

      • 一个比较通用的例子是错误的inflation假设——对过去的inflation的假设或者对未来inflation的假设
    • Approximation error in calculations。因为计算能力限制导致的计算误差。

      • 比如在做simulation的时候,由于计算能力限制,只能跑有限次。每次跑的结果可能有所不同。

    一个通用的处理不确定性的方法:敏感度测试。换一个参数,换一个模型,看看结果会变化多少。

    Resources

    Syllabus

    IFoA 的 SP8 Syllabus.

    Pricing in general insurance

    IFoA推荐用书,也是Cass的老师Pietro先生编写的教材。


登录后回复