年龄段队列与扩展链梯分析

apc的Python项目详细描述


APC

此数据包用于年龄段队列和扩展链梯分析。它允许模型估计和推断、可视化、错误规格测试、分布预测和模拟。该软件包包括二项(广义)对数正态、正态、过分散poisson和poisson模型。共同的因素是线性年龄段队列预测。包装采用匡等人的鉴定方法。(2008)由Nielsen(2015)实施,Nielsen(2015)还讨论了R包的使用APC激发了这个包的灵感。

最新更改

版本1.0.1修复了一些打印错误并重构了生产代码。

版本1.0.0添加了许多新功能。其中包括

  • 复制论文的小插曲(从那些开始!)
  • 分布预测
  • 规格错误测试
  • 更多绘图
  • 从估计模型进行模拟
  • 次采样

用法

  1. 导入包:导入APC
  2. 建立模型:model=apc.model()
  3. 附加并格式化数据:model.data_from_df(pandas.dataframe)
  4. 绘图数据
    • 绘图数据和:model.plot_data_sums()
    • 绘制数据热图:model.plot_data_heatmaps()
    • 在另一个时间刻度上绘制数据组:model.plot_data_within()
  5. 对模型进行拟合和评估
    • 拟合模型:model.fit(family,predictor)
    • 绘图残差:model.plot_residuals()
    • 生成特殊标识的参数化:model.identify()
    • 绘图参数估计:model.plot_parameters()
    • 安装偏差表以检查有效的缩减:model.fit_table()
  6. 误用测试模型
    • r检验(广义)对数正态分布对过分散泊松:apc.r廑检验(pandas.dataframe,family廑null,predictor)
    • 分为子模型:模型.子模型(年龄从u到,每u到,coh到)
    • 巴特利特测试:apc.bartlett_测试(子_型号)
    • F测试:apc.f_测试(型号,子型号)
  7. 形成分布预测:model.forecast()
  8. 绘图分布预测:model.plot_forecast()
  9. 从模型中模拟:模型.模拟(重复)
  10. < > >

    渐晕图

    该软件包包含了一些小插曲,它们复制了许多论文的经验应用。

    包含的数据

    包中包含以下数据。

    石棉

    这些数据是英国间皮瘤死亡人数的年龄段空间。它们可以用带有"APC"或"AC"预测器的泊松模型建模。通过调用apc.石棉()

    资料来源:Martinez Miranda等人。(2015年)。

    比利时肺癌

    这些数据包括比利时在年龄段空间死于肺癌的人数。这个数据集包括一个暴露的度量。它可以使用带有"APC"、"AC"、"AP"或"AD"预测器的泊松模型进行分析。可以通过调用apc.begian_lung_cancer()加载数据。

    资料来源:克莱顿和希夫勒(1987年)。

    Barnett和Zehnwirth(2000年)的径流三角形

    队列年龄(事故发展年)空间中保险流出三角形的数据。此数据已预格式化。众所周知,这些数据需要周期/日历效果进行建模。它们可以用过度分散的poisson"apc"预测器建模。可以通过调用apc.loss\bz()加载数据。

    资料来源:Barnett和Zehnwirth(2000年)。

    泰勒和阿什(1983)的三角跑偏图

    队列年龄(事故发展年)空间中保险流出三角形的数据。此数据已预格式化。 可使用过度分散的泊松模型建模,例如使用"AC"预测。数据可以通过调用apc.loss_ta()来加载

    资料来源:泰勒和阿什(1983年)。

    Verrall等人的Run Off Triangle。(2010)

    队列年龄(事故发展年)空间中已付金额(未报告单位)的保险径流三角形数据。 数据来自皇家太阳联盟丹麦子公司Codan。 它是汽车保险单中的第三方责任组合。时间单位是年。 除了已支付的金额外,还可以计算已报告索赔的数量。支付的金额可以用带"APC"预测的过分散泊松模型建模。可以通过调用apc.loss\vnj()加载数据。

    资料来源:Verrall等人。(2010年)。

    Kuang和Nielsen的三角跑(2018年)

    这些美国伤亡数据来自保险公司xl集团。分录是以1000美元计算的已支付和报告的总损失和分配的损失调整费用。Kuang和Nielsen(2018)考虑了一个广义对数正态模型,该模型对这些数据具有"AC"预测。通过调用apc.loss_kn()

    已知问题

    • 如果初始数据格式不是ca或ac,则索引范围(如1955-1959不适用于预测。问题是,预测设计是通过首先将数据投射到生成未来期间索引的ac数组中来生成的。
    • 索引范围,如model()输出的1955-1959数据向量中。数据是字符串。因此,排序可能会对范围组件长度的中断产生不直观的结果。例如,排序1-3、4-9、10-11得到排序1-3、10-11、4-9。这会导致以后对系数名称的错误标记,因为这些名称是从排序索引中提取的。一个可能的,如果丑陋的,修复方法是根据需要使用零的范围。

    参考文献

    • Barnett,G.,&Zehnwirth,B.(2000年)。储量的最佳估计。意外保险精算学会会议录,87(167),245–321。
    • Clayton,D.和Schiflers,E.(1987)。癌症发病率的时间变化模型。I:年龄段和年龄队列模型。医学统计学6449-467。
    • Harnau,J.,&Nielsen,B.(2017年)。超分散年龄段队列模型。美国统计协会杂志在线提供
    • Harnau,J.(2018a)。对数正态和过分散poisson链梯模型的误判试验。风险,6(2),25.开放访问
    • Harnau,J.(2018b)。对数正态分布还是过分散泊松分布?风险,6(3),70。开放访问
    • Kuang,D.,Nielsen,B.,&Nielsen,J.P.(2008年)。年龄段队列模型和扩展链梯模型的识别。生物计量学,95(4),979-986.开放访问
    • Kuang,D.,&Nielsen,B.(2018年)。广义对数正规链梯。arxiv电子打印,1806.05939。下载
    • 尼尔森,B.(2014)。年龄段队列模型的偏差分析。纽菲尔德讨论文件,(W03)。下载
    • 尼尔森,B.(2015)。APC:年龄段队列分析的R包。R轴颈7,52-64.打开访问
    • Martinez Miranda,医学博士,Nielsen,B.,&Nielsen,J.P.(2015)。年龄段队列模型中未知暴露的推断和预测及其在间皮瘤死亡率中的应用。皇家统计学会学报:A辑(社会统计),178(1),29–55。
    • Taylor,G.C.,Ashe,F.R.(1983年)。未偿索赔估算的第二个时刻。计量经济学杂志
    • Verrall R.,Nielsen J.P.,Jessen A.H.(2010年)。使用索赔金额和索赔计数预测RBN和IBNR索赔。阿斯汀公告40871-887

    欢迎加入QQ群-->: 979659372 Python中文网_新手群

    推荐PyPI第三方库


热门话题
空字符串检查在java中未按预期工作   JavaSpringWebClient:自动计算主体的HMAC签名并将其作为头传递   foreach是否有一个Java等效的foreach循环和一个引用变量?   java如何在Eclipse中导入jar   使用特定第三方或java时lombok触发错误。*方法或构造函数   安卓 java将对象数组转换为int数组   java使一定百分比的JUnit测试通过   java Android:将Seekbar的一个值与另一个值进行比较   java将int数组(图像数据)写入文件的最佳方式是什么   java取代了系统。yml的构造函数内的getProperty   sqlite Java将公钥和私钥转换为字符串,然后再转换回字符串   安卓获取白色像素并将其保存到java opencv中的数组中   java为什么是ServerSocket。setSocketFactory静态?   Java数组似乎在不直接修改的情况下更改值