我有一个数据框,它是由excel电子表格中选定的一些列组成的。在
xls_file = pd.ExcelFile('seedtestexcelbytask.xls')
writer = ExcelWriter('DFExport.xls')
df = xls_file.parse(usecols=[2, 3, 15])
这是数据帧的一个小例子
^{2}$第15列有不同的值,有的用空格隔开,有的用逗号,有的用斜杠隔开,下面是一个例子
Seed 2 1.5in Holon, 26/1/2, 21/2, RW/1/2, H/7
基本上,我试图重新格式化df
,方法是读取一行,保留第3列中的日期值,然后解析第15列的行上的单元格,并进一步分解该单元格,将日期和某些值添加到下一行
2/2/18 83 1
2/2/18 83 2
2/3/18 83 5
2/5/18 26 1
2/5/18 26 2
2/5/18 21 2
2/5/18 RW 1
2/5/18 RW 2
2/5/18 H 7
我尝试过xlrd和xlwt选项,但发现我只是不断地添加嵌套for循环,但我不认为这是最有效的方法,或者是这样?我发现了熊猫iterrows()
,但我很难找到我想要的输出。我不认为我需要一些可以复制和粘贴的代码,但是作为Python新手,我很难正确地实现pandas。作为Python的新手,任何一个指针都是很棒的!!在
你可以试试这个:
结果:
^{pr2}$相关问题 更多 >
编程相关推荐