R | 精算后花园 | 精算学习交流论坛

Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you may not be able to execute some actions.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

登录以发表

M

Unsupervised learning学习资料
• Mengkelyu

1

0
赞同

1
帖子

6
浏览

尚无回复
M

R for Actuarial Science Students
• Mengkelyu

1

0
赞同

1
帖子

6
浏览

尚无回复
M

Subsetting Data R
• Mengkelyu

2

0
赞同

2
帖子

8
浏览

M

什么时候可以用 - 反选，什么时候不能用 - 反选例子一：这个例子里面，我们选择了前三行作为测试集，用了后面的行作为训练集 split <- c(1,2,3) train <- mydata[split,] test <- mydata[-split,] 例子二：这个例子里面，我们选择了 ID < 50 作为训练集，其它为测试集 split <- mydata$ID < 50 # 这里split的结果是一个包含了True和False的数列!!! train <- mydata[split,] test <- mydata[!split,] 下面的例子都是从网上找到的可以replicate的代码例子一： data(mtcars) ## 75% of the sample size smp_size <- floor(0.75 * nrow(mtcars)) ## set the seed to make your partition reproducible set.seed(123) train_ind <- sample(seq_len(nrow(mtcars)), size = smp_size) # 注释：这里用sample生成的是从最大行数里面随便选的一些行数 train <- mtcars[train_ind, ] test <- mtcars[-train_ind, ] 例子二： n = nrow(dataset) split = sample(c(TRUE, FALSE), n, replace=TRUE, prob=c(0.75, 0.25)) # 注释：这里用sample生成的是用True和False组成的，长度为原本数据集长度的变量 training = dataset[split, ] testing = dataset[!split, ]
M

精算R包actuar
• Mengkelyu

5

0
赞同

5
帖子

21
浏览

M

参考文献 https://cran.r-project.org/web/views/Distributions.html actuar.pdf Simulation+of+Compound+Hierarchical+Models+in+R.pdf https://cran.r-project.org/web/packages/actuar/vignettes/credibility.pdf
M

如何安装Github中的R包
• Mengkelyu

1

1
赞同

1
帖子

4
浏览

尚无回复
M

ggplot examples
• Mengkelyu

1

0
赞同

1
帖子

6
浏览

尚无回复
M

Wilcoxon signed-rank test using R
• Mengkelyu

2

0
赞同

2
帖子

7
浏览

M

当然，也可以用stats包来完成这一任务 library(stats) wilcox.test(x, y)
谢

罚广义线性模型：LASSO vs 岭回归
• 谢远涛

7

1
赞同

7
帖子

23
浏览

M

Ridge罚回归的贝叶斯解释: Bayesian interpretation of regularization 普通OLS回顾对于普通的OLS回归，当假设残差项为正态分布时，我们可以把它算作MLE（Maximum likelihood regression) $y = β_{0} + β_{1} \times x_{1} + β_{2} \times x_{2} + . . . β_{n} \times x_{n} + e$ ( $β_{0} + β_{1} \times x_{1} + β_{2} \times x_{2} + . . . β_{n} \times x_{n}$ 用向量表示的话就是 $X β$ ) $Likelihood : L (β | X) = p (Y | X, β)$ MLE的任务就是要最大化likelihood。因为 $e 服从 N (0, σ_{e}^{2})$ , 所以 $y 服从 N (X β, σ_{e}^{2} I)$ 因此, likelihood 可以表示为 $Likelihood N (X β, σ_{e}^{2} I) \propto e x p (- \frac{1}{2 σ_{e}^{2}} | | Y - X β | |^{2})$ 所以得出结论：需要找到让 $| | Y - X β | |^{2}$ 最小的 $β$ 罚回归这里要引入MAP的概念(maximum a posteriori estimate)，是指最大化后验分布概率罚回归相当于我们假设 $β$ 的先验分布是正态分布 $N (0, τ^{2} I)$ 其中 $τ$ 是未知常量根据贝叶斯公式，可以得到 $p (β | X, Y) \propto p (Y | X, β) p (β)$ $Likelihood \propto e x p (- \frac{1}{2 σ_{e}^{2}} | | Y - X β | |^{2}) \times e x p (- \frac{1}{2 τ^{2}} | | β | |_{2}^{2})$ 最大化likelihood就是最小化 $| | Y - X β | |^{2} + \frac{σ_{e}^{2}}{τ^{2}} | | β | |_{2}^{2}$ 其中 $\frac{σ_{e}^{2}}{τ^{2}}$ 就是参数 $l a m b d a$
谢

再保险中高阶矩计算：对数正态分布与正态分布
• 谢远涛

2

1
赞同

2
帖子

12
浏览

J

给谢老师点赞~好多帖子帮老师排了下版~
谢

朴素贝叶斯
• 谢远涛

1

0
赞同

1
帖子

8
浏览

尚无回复
M

R中对于日期型数据的处理
• Mengkelyu

2

0
赞同

2
帖子

11
浏览

M

注意，如果有一些数据无法转换为日期格式，as.Date会给出NA，但是不会有警告所以我们也可以用另一个著名的用来处理日期的包，lubridate，语法为 parse_date_time(表名称$列名称,"%d/%m/%Y") 这个函数会对没能转换的值提出警告： Warning message: 1 failed to parse. 这个包的参考文件如下： lubridate.pdf lubridate cheatsheet.pdf

2 / 2

Unsupervised learning学习资料 • Mengkelyu

R for Actuarial Science Students • Mengkelyu

Subsetting Data R • Mengkelyu

精算R包actuar • Mengkelyu

如何安装Github中的R包 • Mengkelyu

ggplot examples • Mengkelyu

Wilcoxon signed-rank test using R • Mengkelyu

罚广义线性模型：LASSO vs 岭回归 • 谢远涛

再保险中高阶矩计算：对数正态分布与正态分布 • 谢远涛

朴素贝叶斯 • 谢远涛

R中对于日期型数据的处理 • Mengkelyu

Unsupervised learning学习资料
• Mengkelyu

R for Actuarial Science Students
• Mengkelyu

Subsetting Data R
• Mengkelyu

精算R包actuar
• Mengkelyu

如何安装Github中的R包
• Mengkelyu

ggplot examples
• Mengkelyu

Wilcoxon signed-rank test using R
• Mengkelyu

罚广义线性模型：LASSO vs 岭回归
• 谢远涛

再保险中高阶矩计算：对数正态分布与正态分布
• 谢远涛

朴素贝叶斯
• 谢远涛

R中对于日期型数据的处理
• Mengkelyu