我试图转置多个相同格式的文件,并将它们合并成一个大的CSV文件。我想用numpy来转置,因为这是一种非常快速的方法,但它不知怎么地跳过了我需要的所有头文件。这些是我的档案:
testfile1.csv
time,topic1,topic2,country
2015-10-01,20,30,usa
2015-10-02,25,35,usa
testfile2.csv
time,topic3,topic4,country
2015-10-01,40,50,uk
2015-10-02,45,55,uk
这是我的代码,用于将所有csv文件转换并合并为一个大文件:
^{pr2}$这是打印输出。它显示了一些转置工作,但缺少我的标题:
[[ nan nan nan nan]
[ nan 20. 30. nan]
[ nan 25. 35. nan]] my_data, not transposed
[[ nan nan nan]
[ nan 20. 25.]
[ nan 30. 35.]
[ nan nan nan]] transposed_data
这是我的预期输出:
,2015-10-01,2015-10-02,country
topic1,20,25,usa
topic2,30,35,usa
topic3,40,45,uk
topic4,50,55,uk
在
genfromtxt
中有多种处理头的方法。默认情况下,将它们视为数据的一部分:但是由于默认的dtype是float,所以字符串都显示为
nan
。在您可以将它们视为标头-结果是一个结构化数组。标题现在出现在
^{pr2}$data.dtype.names
列表中。在使用
dtype=None
,让它选择数据类型。基于第一行中的字符串,它以S10
的形式加载所有内容。在此矩阵可以转置、打印或写入csv文件:
因为我使用
genfromtxt
来加载,所以我可以使用savetxt
来保存:相关问题 更多 >
编程相关推荐