我是python新手,如果您能尽快给我答复,我将不胜感激。在
我正在处理一个文件,其中包含可以属于一个以上类别的产品的评论。我需要的是按类别和日期对评审评分进行分组。由于我事先不知道类别的确切数量或日期,所以在处理评论数据(50GB文件)时,我需要添加行和列。在
我已经了解了如何添加列,但是我的问题是添加行时不知道dataframe中当前有多少列。在
这是我的代码:
list1=['Movies & TV', 'Books'] #categories so far
dfMain=pandas.DataFrame(index=list1,columns=['2002-09']) #only one column at the beginnig
print(dfMain)
以下是dfMain的外观:
如果要添加列,只需执行以下操作: 插入.dfMain(0,date,0)#其中日期的格式为“2002-09”
但是如果我想添加一个新的类别(行)并用零填充所有的日期(列)?我该怎么做?我尝试过append方法,但它要求所有列作为参数。方法插入似乎也不起作用。。在
这里有一个可能的解决方案:
相关问题 更多 >
编程相关推荐