处理数据集中缺少的值
missing-values的Python项目详细描述
UCS633项目提交
- Name-Kartikey Tiwari
- Roll no.-101703282
缺少值\
missing_values是一个Python包,用于处理数据集中丢失的值。在
缺少值
这里是€™以下是数据丢失的一些典型原因: 用户忘记填写字段。 从旧数据库手动传输数据时丢失。 出现编程错误。 用户选择不填写与他们对如何使用或解释结果的信念相关的字段。 如你所见,其中一些来源只是简单的随机错误。其他时候,数据丢失还有更深层的原因。 它是€™从统计学的角度理解这些不同类型的缺失数据是很重要的。缺失数据的类型将影响您如何填写缺失的值。在
入门
这些说明将帮助您安装和使用此软件包以供一般使用。在
先决条件
csv文件不应包含分类数据
安装
使用包管理器pip安装缺少的值。在
pip install missing_values
使用
您可以在pythonidle中导入它,也可以直接通过命令提示符运行
对于命令提示符
如果要在“上使用此软件包”数据.csv“文件。更改目录的位置“数据.csv“存储,然后传递csv文件的名称(”数据.csv)作为输入,没有丢失值的新csv文件将存储为“Mis”singValuesRemovedata.csv““
^{pr2}$对于Python IDLE
frommissing_values.missingimportmissing_valuesmissing_values(file1)#file1 is name of your csv file on which you will perform operation
示例数据集
TK104 | TK105 | TK107 | ||
---|---|---|---|---|
254 | 263 | 338 | ||
440 | NA | 470 | ||
501 | NA | 558 | ||
368 | 451 | 426 | ||
697 | 709 | 733 | ||
476 | 542 | 539 | ||
188 | 223 | 240 | ||
525 | 659 | 628 | ||
451 | 689 | 517 | ||
517 | 509 | 564 | ||
370 | 321 | 435 | ||
NA | 403 | 306 | ||
NA | 690 | 558 | ||
NA | 460 | 358 | ||
396 | 492 | 429 |
结果
^{tb2}$贡献
欢迎拉取请求。对于重大变化,请先打开一个问题,讨论您希望更改的内容。在
请确保根据需要更新测试。在
许可证
- 项目
标签: