我有一个包含数百万行的CSV文件,格式如下:
start, finish,count;
101,101,10;
101,103,2;
101,104,8;
102,103,5;
所以我们有一个开始的地点,一个结束的地点,还有一个旅行人数的统计。你知道吗
我想做的是把它放入一个“表样式”矩阵,所有的起始位置沿着顶部,所有的结束位置沿着侧面,在矩阵的主体中,有一个位于该相交点内的所有计数的总和。你知道吗
到目前为止,我已经清理和导入了CSV文件,并将开始和结束位置存储为向量,但我不确定如何继续形成矩阵体时,有人能帮忙吗?你知道吗
谢谢你。你知道吗
编辑:我希望它看起来如下:
101,102;
101,10,0;
103,2,5;
104,8,0;
你说你有数百万行,所以我不知道这是否会有效,但如果你没有遇到内存问题,熊猫数据帧是一种方法:
另一个带有^{} 的解决方案:
如果需要删除列和索引名,请使用^{} (在
pandas
0.18.0
中新增):使用
set_index
和unstack
保存到csv
相关问题 更多 >
编程相关推荐