使用Zscore或IQR去除异常值
outlier-101703382的Python项目详细描述
从pandas数据帧中删除异常值的库
PROJECT 2, UCS633 - Data Analysis and Visualization
Paras Arora
COE18
Roll number: 101703382
接受两个输入-输入csv的文件名,输出csv的预期文件名。在
Output是从输入中删除的行数数据集。它在IQR的情况下还显示新的数据集
Output是z-score时从输入数据集中删除的行数
安装
pip install outlier_101703382
Recommended-在虚拟环境中测试。
通过命令行使用
^{pr2}$outcli后面的第一个参数是从中提取数据集的输入csv文件名。第二个参数用于存储处理后的最终数据集。在
在.py脚本中使用
from outlier_101703382 import remove_outliers_iqr
remove_outliers('input.csv', 'output.csv')
from outlier_101703382 import remove_outliers
remove_outliers('input.csv', 'output.csv',threshold)
- 项目
标签: