预测模型中混杂效应控制的混杂交叉验证方法。
confound-prediction的Python项目详细描述
混杂预测
Confound_prediction是一个Python模块,用于控制预测或分类模型中的混杂效应
任何成功的预测模型都可能受到与兴趣效应相关的混杂效应的驱动。重要的是要控制检测到的关联不受不需要的影响。它是神经科学、流行病学、经济、农业等领域的常见问题
本模块提供3种方法来处理预测模型中的混杂效应:
1。混杂隔离交叉验证
2。样本外去结晶
3。拆散试验与联合训练(不应使用,仅作说明)
混杂隔离交叉验证
“混杂隔离交叉验证”是一种控制预测模型中混杂效应的非参数方法。它是建立在一个测试集的基础上,在这个测试集上,兴趣的影响独立于混杂效应。在
从混淆预测中可以得到什么?
所开发的框架基于反互信息抽样,这是一种新的抽样方法,可以创建一个测试集,其中兴趣效应独立于混杂效应。经典和混淆隔离交叉验证的图示:
它是如何工作的?
您提供给我们
变量: 在
- X-具有形状的数据(n个示例,n个特征)
- y-带形状的目标向量(n个示例)
- z-将向量与形状混淆(n个示例)
可选参数
- min_sample_size—要达到的最小样本大小,默认值是数据的10%
- n_remove-每次采样迭代要删除的样本数,默认值为4
- prng-控制伪随机数生成器,默认值为None
- cv_folds—交叉验证中的文件夹数,默认值为10
我们返回给您
变量:
- x{x}$x、x{em1}$y和{em1}$y和{em1}$y抽样指标
安装
家属
confound_预测软件包要求:
- Python(>;=3.5)
- 压缩(>;=1.1.0)
- Scikit学习(>;=0.21.2)
- 数量(>;=1.14.2)
- Pytest(>;=5.1.1)
可选依赖项:
- Matplotlib(>;=2.2.2),例如可视化
- Seaborn(>;=0.8),例如可视化
用户安装
pipinstallTBD
示例
示例:创建无混淆效果的列车集和测试集
^{pr2}$例:对目标与混杂有直接联系的数据,用不同解算方法对采样数据进行预测比较
pythonexample/Example-prediction-different-deconfounding-direct-confound.py
例:对不同混杂效应的数据进行预测比较
pythonexample/Example-prediction-isolatingcv-deconfounding-dif-confound.py
示例:在“混杂隔离交叉验证”方法的每一次测试中,互信息和相关性的演变
pythonexample/Example_compare_mutual_info_correlation.py
参考文献
[1]待定
[2]D.Chyzhyk,G.Varoquiaux,B.Thirion和M.Milham,“用最小化其影响的测试集控制预测模型中的混杂”,2018年神经成像模式识别国际研讨会,新加坡,2018年,第1-4页。 doi:10.1109/PRNI.2018.8423961PDF
- 项目
标签: