几何烟雾算法。
geometric-smote的Python项目详细描述
几何打击
一个几何增强的几何smote算法[1]的实现 代替斯马特的替补。它与scikit-learn和 imbalanced-learn。
文件
安装文档、API文档和示例可以在 documentation。
依赖性
Geometric Smote在Python3.6+下运行。依赖关系是 以下内容:
- 纽比(>;=1.1)
- 科学套件学习(>;=0.21)
- 不平衡学习(>;=0.4.3)
此外,要运行示例,需要matplotlib(>;=2.0.0)和 熊猫(>;=0.22)。
安装
Geometric Smote目前在Pypi的存储库中可用,您可以 通过pip安装
pip install -U geometric-smote
该软件包也在anaconda云平台发布:
conda install -c algowit geometric-smote
如果愿意,可以克隆它并运行setup.py文件。使用以下命令 从github获取副本并安装所有依赖项的命令:
git clone https://github.com/AlgoWit/geometric-smote.git cd geometric-smote pip install .
或者使用pip和github安装:
pip install -U git+https://github.com/AlgoWit/geometric-smote.git
测试
安装后,您可以使用pytest运行测试套件:
make test
关于
如果你在科学出版物中使用几何烟雾,我们将不胜感激 以下论文的引文:
@article{Douzas2019, doi = {10.1016/j.ins.2019.06.007}, url = {https://doi.org/10.1016/j.ins.2019.06.007}, year = {2019}, month = oct, publisher = {Elsevier {BV}}, volume = {501}, pages = {118--135}, author = {Georgios Douzas and Fernando Bacao}, title = {Geometric {SMOTE} a geometrically enhanced drop-in replacement for {SMOTE}}, journal = {Information Sciences} }
不平衡数据集的分类是一项具有挑战性的标准任务。 算法。虽然存在许多方法来解决这个问题在不同的 为少数民族生成人工数据是一种更普遍的方法 方法与算法修改进行比较。smote算法[2],以及 与基于smote机制的任何其他过采样方法一样,生成 沿连接少数类实例的线段的合成采样。 几何烟雾(g-smote)是烟雾数据生成的增强 机制。烟雾在 输入空间,围绕每个选定的少数派实例。
参考文献:
[1] | G. Douzas, F. Bacao, “Geometric SMOTE: a geometrically enhanced drop-in replacement for SMOTE”, Information Sciences, vol. 501, pp. 118-135, 2019. |
[2] | N. V. Chawla, K. W. Bowyer, L. O. Hall, W. P. Kegelmeyer, “SMOTE: synthetic minority over-sampling technique”, Journal of Artificial Intelligence Research, vol. 16, pp. 321-357, 2002. |