imblearn包的附加功能
imbutil的Python项目详细描述
添加到imbalanced-learn包。
fromimbutil.combineimportMinMaxRandomSampler;fromimblearnimportpipeline;# oversampling minority classes to 100 and undersampling majority classes to 800sampler=MinMaxRandomSampler(min_freq=100,max_freq=800)sampling_clf=pipeline.make_pipeline(sampler,inner_clf)
内容
1 Installation
pip install imbutil
此外,除了来自imbalanced-learn的RandomUnderSampler和RandomOverSampler之外,技术上可以将MinMaxRandomSampler用于非数字数据。但是,imbalanced-learn的当前实现强制检查所有采样器的数字数据。如果你想绕过这个限制,我有一个不强制数据为数字的项目分支。您可以使用以下命令安装它:
pip install git+https://github.com/shaypal5/imbalanced-learn.git@f6adc562fafdc2198931873799e725e5abdd65a1
3 Contributing
包作者和当前维护者是shay palachy(shay.palachy@gmail.com);非常欢迎您向他寻求帮助。捐款是非常受欢迎的。
3.1 Installing for development
克隆:
git clone git@github.com:shaypal5/imbutil.git
以开发模式安装,并具有测试依赖项:
cd imbutil pip install -e ".[test]"
3.3 Adding documentation
该项目使用numpy docstring conventions进行文档记录,之所以选择它们,是因为它们可能是最广泛传播的约定,既受sphinx等常用工具的支持,又产生人类可读的docstring。在记录添加到此项目中的代码时,请遵循these conventions。
另外,如果您更新了这个README.rst文件,请使用python setup.py checkdocs验证它的编译。
4 Credits
由shay palachy创建(shay.palachy@gmail.com)。