正无标记材料机器学习(pumml)是一种在数据不完整且只有“正”材料示例可用时,使用半监督正无标记(pu)机器学习对材料进行分类的代码。
pumml的Python项目详细描述
泵
正无标记材料机器学习(pumml)是一种在数据不完整且只有“正”材料示例可用时,使用半监督正无标记(pu)机器学习对材料进行分类的代码。作为一个例子,pumml被用来从合成材料的“正”例子预测体材料和二维材料的“可合成性”。
如何引用pumml
如果您在研究中使用pumml,请引用以下工作:
Nathan C. Frey, Jin Wang, Gabriel Iván Vega Bellido, Babak Anasori, Yury Gogotsi, and Vivek B. Shenoy. Prediction of Synthesis of 2D Metal Carbides and Nitrides (MXenes) and Their Precursors with Positive and Unlabeled Machine Learning. ACS Nano 2019 13 (3), 3031-3041.
还请考虑引用建立pumml基本方法的原始作品:
Elkan, Charles, and Keith Noto. Learning classifiers from only positive and unlabeled data. Proceeding of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2008.
Mordelet, F.; Vert, J.-P. A Bagging SVM to Learn from Positive and Unlabeled Examples. Pattern Recognit. Lett. 2014, 37, 201−209.
获得pumml
开始使用pumml的最简单方法是使用python3.6创建一个虚拟环境,然后
pip install pumml
您还可以创建一个虚拟环境,克隆此repo并执行
python setup.py install
在根目录中。
使用pumml
一个名为example_nb.ipynb
的jupyter笔记本示例显示了包的基本功能。
关于pumml
有关使用pu学习进行材料合成预测的更多信息,请参阅我们的出版物:DOI: 10.1021/acsnano.8b08014
https://pubs.acs.org/doi/abs/10.1021/acsnano.8b08014
scikit学习的有用pu学习包装可在以下网址找到:alexandre drouin,pu learning,2013,https://github.com/aldro61/pu-learning
除了我们的基于决策树分类器的反导套袋方案外,我们还推荐了claesen等人提出的鲁棒支持向量机集成(resvm)方法。resvm是一种替代的pu学习方法,它提供了一个优秀的基准。它在这里实现:marc claesen,ensemblesvm,2014,https://github.com/claesenm/EnsembleSVM,这里有一个python包装器:marc claesen,resvm,2014,https://github.com/claesenm/resvm。
许可证
此代码在麻省理工学院许可证下提供。