我有一个名为“abc.data”的文件,其中包含如下形式的元素
39岁,州长,77516岁,单身,13岁,未婚,行政文书,不在家,白人,男性,2174,0,40岁,美国,<=五万 50岁,Self emp not inc,83311岁,单身,13岁,已婚公民配偶,高级管理人员,丈夫,白人,男性,0,0,13岁,美国,<=五万
我想制作一个数组来存储上面的数据,也可以存储X[]中的所有元素,除了最后一个元素,还有Y[]中的最后一个元素
X=[39,州政府,77516,单身,13岁,未婚,行政文书,不在家,白人,男性,2174,0,40,美国] Y=[<;=50K]
试试这个:
读取文件,在逗号处拆分文件(形成一个数组),将每个元素放置在X数组中,最后一个元素放置在Y数组中
扩展上面@kabooya的答案:虽然这个建议有效,但它生成的是X和Y列表,而不是问题中所问的numpy数组。另外,我假设文件中有多行,因此可以循环使用它们来创建记录列表,如下所示:
其中strip()用于清除字符串的尾随空格和前导空格
相关问题 更多 >
编程相关推荐