从数据集中删除异常值的Python pip包

outlier-removal-yash-saxena的Python项目详细描述


利用四分位间距去除离群值行

Project 2:UCS633数据分析和可视化

提交人:Yash saxena 101703627


pypi:https://pypi.org/project/outlier-removal-yash-saxena git:https://github.com/yashsaxena972/outlier-removal


IQR四分位间距说明

任何数据都可以用它的五位数摘要来描述。这五个数字包括(按升序排列):

数据集的最小值或最小值。 第一个四分位数Q1,表示所有数据列表的四分之一。 数据集的中值,表示整个数据列表的中点。 第三个四分位数Q3,表示所有数据列表中四分之三的数据。 数据集的最大值或最高值。在

可接受数据的计算

IQR = Q3-Q1
lower=Q1-(1.5*IQR)
upper=Q3+(1.5*IQR)

在上下之间的数据值是可以接受的,其余的是离群值,因此被删除。在

安装

使用包管理器pip安装删除系统。在

^{pr2}$

如何使用此软件包:

异常值移除yash saxena可以按如下方式运行:

在命令提示符

>> outliers <dataset.csv>

示例数据集

MarksStudents
3S1
57S2
65S3
98S4
43S5
44S6
54S7
99S8
1S9

删除后输出数据集

^{tb2}$

可以清楚地看到,行S1、S8和S9已从数据集中删除。在

许可证

MIT

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java使用唯一的按钮标签单击按钮   代码生成如何使用Java codeModel为数组的特定索引赋值   java如何批量执行Camel SQL插入   java iText 7将ltv添加到现有签名   内存管理Java应用程序突然停止几天后(810)   带MySQL的java注册表单JavaFX在intellij中失败   如何使用eclipse为windows azure java项目启用远程调试   一种通用的java输入输出设计模式   java Android XML(RSS)忽略引号(“”)   java帮助:安卓中的8 X 10 2维按钮数组   java启动Android项目   JWrapper构建java应用程序   java如何在Android应用程序中设置基于日期/时间的默认页面加载?   java循环程序在完成后返回到起点   java Hibernate:更好的整体类还是多类映射?   回溯数独解算器的递归问题[Java]   java查找类用法   java如何在SpringWebFlow中将多个模型绑定到一个视图?