基于CSV创建二维数组

网友

1楼 · 编辑于 2024-05-01 21:56:44

你说你有数百万行，所以我不知道这是否会有效，但如果你没有遇到内存问题，熊猫数据帧是一种方法：

import pandas as pd
df = pd.read_csv('inputfile.csv')

df = df.groupby(['start','finish']).agg({'count':sum}).reset_index()
# Create Pivot table
df_out = df.pivot(index='finish',columns = 'start',values='count')
# Write Output
df_out.rename_axis(None).to_csv('output.csv')

网友

2楼 · 编辑于 2024-05-01 21:56:44

另一个带有^{}的解决方案：

print (df.pivot(index='finish', columns='start', values='count'))
start    101  102
finish           
101     10.0  NaN
103      2.0  5.0
104      8.0  NaN

如果需要删除列和索引名，请使用^{}（在pandas0.18.0中新增）：

print (df.pivot(index='finish', columns='start', values='count')
         .rename_axis(None)
         .rename_axis(None, axis=1))
      101  102
101  10.0  NaN
103   2.0  5.0
104   8.0  NaN

网友

3楼 · 编辑于 2024-05-01 21:56:44

使用set_index和unstack

df.set_index(['start', 'finish'])['count'].unstack(0)

保存到csv

print df.set_index(['start', 'finish'])['count'].unstack(0).rename_axis(None) \
    .to_csv('myfilename.csv')

,101,102
101,10.0,
103,2.0,5.0
104,8.0,

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于CSV创建二维数组

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >