一个Python包,用于使用四分位间距技术删除数据集中的异常值。
outlier-removal-101703289的Python项目详细描述
使用四分位间距去除离群值-Python
Project 2:UCS633
提交人:Khushnuma Grover 101703289
pypi:https://pypi.org/project/outlier-removal-101703289 git:https://github.com/khushgrover/outlier-removal-python.git
什么是异常值?在
如果在进一步的统计/学习阶段没有进行探索性的数据分析,则会影响机器学习。其中之一是查找离群值。在
在统计学中,离群值是一个远离其他观测值的观测点。在
四分位距法
如何使用此软件包:
在这个包中实现了这个方法。它接收数据集csv文件,并在删除离群值的行中输出csv文件。这个包处理单变量数据集和多变量数据集。删除具有离群值行的每个特征。在
OUTLIER-remove-KHUSHNUMA-101703289可以按照以下示例运行:
安装程序包
在命令提示符下运行以下命令:
pip安装离群值-remove-101703289
示例数据集
数据集的构造应该是每一行代表一个数据,每一列代表一个标准特征,以一个目标结束。在
Feature | Target |
---|---|
10 | 0.62 |
100 | 0.44 |
100 | 0.31 |
100 | 0.67 |
10 | 0.56 |
在命令提示符下:
>> remove-outlier data.csv
在Python IDLE中:
^{pr2}$输出
^{tb2}$- 项目
标签: