正无标记材料机器学习(pumml)是一种在数据不完整且只有“正”材料示例可用时,使用半监督正无标记(pu)机器学习对材料进行分类的代码。

pumml的Python项目详细描述


Build StatusCoverage StatusPython 3.6

正无标记材料机器学习(pumml)是一种在数据不完整且只有“正”材料示例可用时,使用半监督正无标记(pu)机器学习对材料进行分类的代码。作为一个例子,pumml被用来从合成材料的“正”例子预测体材料和二维材料的“可合成性”。

如何引用pumml

如果您在研究中使用pumml,请引用以下工作:

Nathan C. Frey, Jin Wang, Gabriel Iván Vega Bellido, Babak Anasori, Yury Gogotsi, and Vivek B. Shenoy. Prediction of Synthesis of 2D Metal Carbides and Nitrides (MXenes) and Their Precursors with Positive and Unlabeled Machine Learning. ACS Nano 2019 13 (3), 3031-3041.

还请考虑引用建立pumml基本方法的原始作品:

Elkan, Charles, and Keith Noto. Learning classifiers from only positive and unlabeled data. Proceeding of the 14th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2008.

Mordelet, F.; Vert, J.-P. A Bagging SVM to Learn from Positive and Unlabeled Examples. Pattern Recognit. Lett. 2014, 37, 201−209.

获得pumml

开始使用pumml的最简单方法是使用python3.6创建一个虚拟环境,然后 pip install pumml

您还可以创建一个虚拟环境,克隆此repo并执行 python setup.py install在根目录中。

使用pumml

一个名为example_nb.ipynb的jupyter笔记本示例显示了包的基本功能。

关于pumml

有关使用pu学习进行材料合成预测的更多信息,请参阅我们的出版物:DOI: 10.1021/acsnano.8b08014https://pubs.acs.org/doi/abs/10.1021/acsnano.8b08014

scikit学习的有用pu学习包装可在以下网址找到:alexandre drouin,pu learning,2013,https://github.com/aldro61/pu-learning

除了我们的基于决策树分类器的反导套袋方案外,我们还推荐了claesen等人提出的鲁棒支持向量机集成(resvm)方法。resvm是一种替代的pu学习方法,它提供了一个优秀的基准。它在这里实现:marc claesen,ensemblesvm,2014,https://github.com/claesenm/EnsembleSVM,这里有一个python包装器:marc claesen,resvm,2014,https://github.com/claesenm/resvm

许可证

此代码在麻省理工学院许可证下提供。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在Eclipse中使用多个调用在一行上打印java   javajackson序列化问题。只有同一实体的第一个对象可以很好地序列化   Java中Deflate函数的等价充气   使用customlitview的java Android actionbar搜索   java“<T>T get()”是什么意思?(它有用吗?)   目标c使用CommonCrypto使用AES256加密,使用OpenSSL或Java解密   java在运行时更新资源文件   fileinputstream在java中访问并将数据写入现有文件   带集群的java Android Mapbox我希望每个功能都有不同的标记图像   java JDK8>JDK10:PKIX路径生成失败:SunCertPathBuilderException:找不到请求目标的有效证书路径   java使用Hk2生成具有指定构造函数参数的实例   为什么这个系统。出来Java中的println()打印到控制台?   java目录和文件名连接不起作用   使用mockito和通配符绘图的java