从多元数据中去除异常值的python包

outlier-remover-101703283的Python项目详细描述


离群值移除器101703283

,用于:Project-2(UCS633)
提交人:Katinder Kaur
Roll no:101703283
Group:3COE13

outlier_remover_101703283是一个Python库,用于处理数据集中的异常或异常值。数据集中异常值的存在非常普遍,尤其是在原始数据中。异常值的去除是一个重要的预处理阶段,因为异常值的存在会严重影响模型的性能和预测精度。 有几种方法可以检测和去除异常值,本脚本使用四分位间距(IQR)作为异常数据的检测方法。在

安装

使用包管理器pip安装离群值移除器101703283。在

pip install outlier_remover_101703283

使用

对于命令提示符:

^{pr2}$

输入输入csv文件名,后跟.csvextension

outlier_remover sample_inputfile.csv

删除异常值的记录后,生成的数据将隐式存储在sample_input中_sansOutliers.csv(即_sansOutliers.csv)在

自定义输出文件名:

可以使用-o标志显式提供目标输出文件名

outlier_remover sample_inputfile.csv -o my_outputfile.csv

本例中的输出数据将存储在名为my的csv文件中_输出文件.csv在

跳过列:

在某些情况下,人们可能希望在分析(如分类数据或索引的情况下),这可以通过使用-c标志来实现

outlier_remover sample_inputfile.csv -c 0,2,8

或者

outlier_remover sample_inputfile.csv -c "0,2,8"

Note:列号从0开始。在

查看帮助

要查看用法help,请使用

outlier_remover -h

对于Python空闲:

>>>fromoutlier_remover.outlier_removerimportoutlier_remover>>>list_of_columns_to_skip=[]>>>outlier_remover('inputfile.csv','outputfile.csv',list_of_columns_to_skip)Removed2row(s)successfully.Savesuccessful!Checkoutputfile.csvforresults>>>fromoutlier_remover.outlier_removerimportoutlier_removerfn>>>outlier_removerfn('sample2.csv')Removed1row(s)successfully.Savesuccessful!Checksans_outliers.csvforresults

许可证

MIT

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
使用jaxrpc的Java eclipse WebService客户端   java编程方式在对象上写入名称   java Spring批处理:重试后跳过   java Android错误:错误:任务执行失败:应用程序:transformClassesWithDexForDebug'   带有清单文件nullPointerException的java Android元数据   spring Java Quartz调度作业停止运行   JavaMockito:如何在不调用实际方法的情况下,模拟带有参数和无效返回类型的静态方法?   java Tomcat连接池问题无法在关闭的连接上调用方法   java如何交换列表中的项目?   java如何停止线程并通过Toast在线程中正确显示文本?   java为什么连续写入OutputStream时偏移量0不会导致重复字节?   java我无法生成头文件   不兼容的返回类型错误java   修改值后键值对的java Jolt转换规范   java有自动更新Javadoc的工具吗?   java线程如何在ints自身实例类中共享变量   java继承一个非gwt模块   java Hibernate xml配置   使用netty4异步调用的java链接HTTP请求响应