从多元数据中去除异常值的python包
outlier-remover-101703283的Python项目详细描述
离群值移除器101703283
,用于:Project-2(UCS633)
提交人:Katinder Kaur
Roll no:101703283
Group:3COE13
outlier_remover_101703283是一个Python库,用于处理数据集中的异常或异常值。数据集中异常值的存在非常普遍,尤其是在原始数据中。异常值的去除是一个重要的预处理阶段,因为异常值的存在会严重影响模型的性能和预测精度。 有几种方法可以检测和去除异常值,本脚本使用四分位间距(IQR)作为异常数据的检测方法。在
安装
使用包管理器pip安装离群值移除器101703283。在
pip install outlier_remover_101703283
使用
对于命令提示符:
^{pr2}$输入输入csv文件名,后跟.csvextension
outlier_remover sample_inputfile.csv
删除异常值的记录后,生成的数据将隐式存储在sample_input中_sansOutliers.csv(即_sansOutliers.csv)在
自定义输出文件名:
可以使用-o标志显式提供目标输出文件名
outlier_remover sample_inputfile.csv -o my_outputfile.csv
本例中的输出数据将存储在名为my的csv文件中_输出文件.csv在
跳过列:
在某些情况下,人们可能希望在分析(如分类数据或索引的情况下),这可以通过使用-c标志来实现
outlier_remover sample_inputfile.csv -c 0,2,8
或者
outlier_remover sample_inputfile.csv -c "0,2,8"
Note:列号从0开始。在
查看帮助要查看用法help,请使用
outlier_remover -h
对于Python空闲:
>>>fromoutlier_remover.outlier_removerimportoutlier_remover>>>list_of_columns_to_skip=[]>>>outlier_remover('inputfile.csv','outputfile.csv',list_of_columns_to_skip)Removed2row(s)successfully.Savesuccessful!Checkoutputfile.csvforresults>>>fromoutlier_remover.outlier_removerimportoutlier_removerfn>>>outlier_removerfn('sample2.csv')Removed1row(s)successfully.Savesuccessful!Checksans_outliers.csvforresults
许可证
- 项目
标签: