年龄段队列与扩展链梯分析
apc的Python项目详细描述
APC
此数据包用于年龄段队列和扩展链梯分析。它允许模型估计和推断、可视化、错误规格测试、分布预测和模拟。该软件包包括二项(广义)对数正态、正态、过分散poisson和poisson模型。共同的因素是线性年龄段队列预测。包装采用匡等人的鉴定方法。(2008)由Nielsen(2015)实施,Nielsen(2015)还讨论了R包的使用APC
激发了这个包的灵感。
最新更改
版本1.0.1修复了一些打印错误并重构了生产代码。
版本1.0.0添加了许多新功能。其中包括
- 复制论文的小插曲(从那些开始!)
- 分布预测
- 规格错误测试
- 更多绘图
- 从估计模型进行模拟
- 次采样
用法
- 导入包:
导入APC
- 建立模型:
model=apc.model()
- 附加并格式化数据:
model.data_from_df(pandas.dataframe)
- 绘图数据
- 绘图数据和:
model.plot_data_sums()
- 绘制数据热图:
model.plot_data_heatmaps()
- 在另一个时间刻度上绘制数据组:
model.plot_data_within()
- 绘图数据和:
- 对模型进行拟合和评估
- 拟合模型:
model.fit(family,predictor)
- 绘图残差:
model.plot_residuals()
- 生成特殊标识的参数化:
model.identify()
- 绘图参数估计:
model.plot_parameters()
- 安装偏差表以检查有效的缩减:
model.fit_table()
- 拟合模型:
- 误用测试模型
- r检验(广义)对数正态分布对过分散泊松:
apc.r廑检验(pandas.dataframe,family廑null,predictor)
- 分为子模型:
模型.子模型(年龄从u到,每u到,coh到)
- 巴特利特测试:
apc.bartlett_测试(子_型号)
- F测试:
apc.f_测试(型号,子型号)
- r检验(广义)对数正态分布对过分散泊松:
- 形成分布预测:
model.forecast()
- 绘图分布预测:
model.plot_forecast()
- 从模型中模拟:
模型.模拟(重复)
< > > - 复制Harnau和Nielsen(2017年)
- 非寿险索赔准备金
- 过分散泊松偏差分析、参数不确定性和分布预测
- 复制harnau(2018a)
- 非寿险索赔准备金
- 用bartlett和f检验检验对数正态或过分散poisson模型的检验规范
- 复制harnau(2018b)
- 非寿险索赔准备金
- 过分散泊松模型和(广义)对数正态模型之间的直接检验
- (松散)复制martinez miranda等人。(2015)
- 间皮瘤死亡率预测
- 数据绘图、泊松偏差分析、参数不确定性、残差图和分布预测,包括图
- 复制匡和尼尔森(2018)
- 非寿险索赔准备金
- 广义对数正态模型的估计、检验和预测。与过分散泊松模型的比较。
- 复制尼尔森(2014年)
- 比利时肺癌数据分析
- 泊松剂量-反应模型中的估算、测试和绘图。非标准限制测试。关于鉴定的简要讨论。
- 如果初始
数据格式不是ca或ac,则索引范围(如1955-1959不适用于预测。问题是,预测设计是通过首先将数据投射到生成未来期间索引的ac数组中来生成的。
- 索引范围,如
model()输出的1955-1959在
数据向量中。数据是字符串。因此,排序可能会对范围组件长度的中断产生不直观的结果。例如,排序1-3、4-9、10-11得到排序1-3、10-11、4-9。这会导致以后对系数名称的错误标记,因为这些名称是从排序索引中提取的。一个可能的,如果丑陋的,修复方法是根据需要使用零的范围。
- Barnett,G.,&Zehnwirth,B.(2000年)。储量的最佳估计。意外保险精算学会会议录,87(167),245–321。
- Clayton,D.和Schiflers,E.(1987)。癌症发病率的时间变化模型。I:年龄段和年龄队列模型。医学统计学6449-467。
- Harnau,J.,&Nielsen,B.(2017年)。超分散年龄段队列模型。美国统计协会杂志。在线提供
- Harnau,J.(2018a)。对数正态和过分散poisson链梯模型的误判试验。风险,6(2),25.开放访问
- Harnau,J.(2018b)。对数正态分布还是过分散泊松分布?风险,6(3),70。开放访问
- Kuang,D.,Nielsen,B.,&Nielsen,J.P.(2008年)。年龄段队列模型和扩展链梯模型的识别。生物计量学,95(4),979-986.开放访问
- Kuang,D.,&Nielsen,B.(2018年)。广义对数正规链梯。arxiv电子打印,1806.05939。下载
- 尼尔森,B.(2014)。年龄段队列模型的偏差分析。纽菲尔德讨论文件,(W03)。下载
- 尼尔森,B.(2015)。APC:年龄段队列分析的R包。R轴颈7,52-64.打开访问
- Martinez Miranda,医学博士,Nielsen,B.,&Nielsen,J.P.(2015)。年龄段队列模型中未知暴露的推断和预测及其在间皮瘤死亡率中的应用。皇家统计学会学报:A辑(社会统计),178(1),29–55。
- Taylor,G.C.,Ashe,F.R.(1983年)。未偿索赔估算的第二个时刻。计量经济学杂志
- Verrall R.,Nielsen J.P.,Jessen A.H.(2010年)。使用索赔金额和索赔计数预测RBN和IBNR索赔。阿斯汀公告40871-887
渐晕图
该软件包包含了一些小插曲,它们复制了许多论文的经验应用。
包含的数据
包中包含以下数据。
石棉
这些数据是英国间皮瘤死亡人数的年龄段空间。它们可以用带有"APC"或"AC"预测器的泊松模型建模。通过调用apc.石棉()
资料来源:Martinez Miranda等人。(2015年)。
比利时肺癌
这些数据包括比利时在年龄段空间死于肺癌的人数。这个数据集包括一个暴露的度量。它可以使用带有"APC"、"AC"、"AP"或"AD"预测器的泊松模型进行分析。可以通过调用apc.begian_lung_cancer()加载数据。
资料来源:克莱顿和希夫勒(1987年)。
Barnett和Zehnwirth(2000年)的径流三角形
队列年龄(事故发展年)空间中保险流出三角形的数据。此数据已预格式化。众所周知,这些数据需要周期/日历效果进行建模。它们可以用过度分散的poisson"apc"预测器建模。可以通过调用apc.loss\bz()
加载数据。
资料来源:Barnett和Zehnwirth(2000年)。
泰勒和阿什(1983)的三角跑偏图
队列年龄(事故发展年)空间中保险流出三角形的数据。此数据已预格式化。 可使用过度分散的泊松模型建模,例如使用"AC"预测。数据可以通过调用apc.loss_ta()来加载
资料来源:泰勒和阿什(1983年)。
Verrall等人的Run Off Triangle。(2010)
队列年龄(事故发展年)空间中已付金额(未报告单位)的保险径流三角形数据。
数据来自皇家太阳联盟丹麦子公司Codan。
它是汽车保险单中的第三方责任组合。时间单位是年。
除了已支付的金额外,还可以计算已报告索赔的数量。支付的金额可以用带"APC"预测的过分散泊松模型建模。可以通过调用apc.loss\vnj()
加载数据。
资料来源:Verrall等人。(2010年)。
Kuang和Nielsen的三角跑(2018年)
这些美国伤亡数据来自保险公司xl集团。分录是以1000美元计算的已支付和报告的总损失和分配的损失调整费用。Kuang和Nielsen(2018)考虑了一个广义对数正态模型,该模型对这些数据具有"AC"预测。通过调用apc.loss_kn()