与Pandas一起打开NSFG数据(来自ThinkStats图书)

2024-05-15 15:13:37 发布

您现在位置:Python中文网/ 问答频道 /正文

我在看ThinkStats的书。http://greenteapress.com/thinkstats/nsfg_data.html

我更喜欢和熊猫一起工作,因为我想加强我在这方面的技能,但我很难弄清楚如何打开这个文件。在

http://greenteapress.com/thinkstats/nsfg_data.html

像往常一样pd.read_csv文件(文件名)似乎不起作用。 我也在阅读随书提供的代码,但对我来说有点难以理解。在


Tags: 文件csvcomhttpreaddata文件名html
1条回答
网友
1楼 · 发布于 2024-05-15 15:13:37

如果不考虑数据集本身,pandas read_csv函数将无法处理此数据集。实际上,它既不是逗号分隔的值,也不是空格分隔的格式。在

相反,它是一种自制格式,每行的字段数不一致,这是另一个问题。此外,值之间的空格数不是常量,这是另一个问题。在

为了更好地理解数据文件的格式,我建议您从作者处获取代码。本书中提供了链接,但它在这里http://greenteapress.com/thinkstats/,并使用提供的代码来确定所使用的格式

如果您有数据文件,则可以使用“调查”模块

import survey
preg = survey.Pregancies()
pre.ReadRecors(".")

相关问题 更多 >