关于删除评论网站的问题

有些学生只对某些方面作了评论。他们不评论的方面不会在网站上显示

每次代码评审

<div class="mod-reviewTop">  <div class="mod-reviewTop-inner"> <dl> <dd> <div class="mod-reviewTitle" itemprop="summary"> title 1 : It was ok. </div> </dd> </dl>  </div>   <div class="mod-reviewBottom">  <div class="mod-reviewList-list js-review-detail" itemprop="description">  <div class="js-mod-reviewList-list"> <ul> <li> <div class="mod-reviewTitle3"> Total Evaluation </div> <div class="mod-reviewList-txt"> We can freely choose the course we want, and thus a lot of different knowledge can be learned. </div> </li> <li> <div class="mod-reviewTitle3"> Course </div> <div class="mod-reviewList-txt"> the courses are good. </div> </li> <li> <div class="mod-reviewTitle3"> Lab </div> <div class="mod-reviewList-txt"> we don’t join lab in the first 2 year. </div> </li> </ul> </div>  </div>  </div>

您可以看到，尽管方面的标题不同，但它们都以'div^{cl1}$开头，注释都以'div^{cl2}$开头。我的问题是如何编写好代码将这些信息存储到数据集中：

|标题| aspect1注释| aspect2注释
很好很好

我已经尝试了下面的代码，但是每个块中的方面注释都不起作用

datatest = soup.find_all("div", {"class":"mod-reviewTop"}) datatest1 = soup.find_all("div", {"class":"mod-reviewBottom"}) for item in datatest: a = item.select('.mod-reviewTitle') c = item.select('.mod-reviewTitle3') d = item.select('.mod-reviewList-txt') g = item.select('.js-mod-reviewList-list') f= item.select('.mod-reviewItem') for i in range(len(a)): f1= f[i].text[7] f2= f[i].text[17] f3= f[i].text[26] f4= f[i].text[37] f5= f[i].text[46] f6= f[i].text[55] f7= f[i].text[63] print a[i].text print f1, f2, f3, f4, f5, f6, f7 for item in datatest1: for k in range(len(g)): print g[k].text print e[k].text print k

我认为这是一个编程问题。。我试过，但效果不好

如果您能给我一些参考或如何结构将工作逻辑，请给我一个意见。。谢谢

1条回答

网友
1楼 · 发布于 2024-05-29 09:49:46

提示：
您应该将aspects和comments附加到相应的titles，这意味着您可以使用适当的数据结构将它们存储在一起。像这样（只是一种可能的方式）
[ (title1,[ (aspect1, comment1), (aspect2, comment2), ... ]), (title2,[ (aspect1, comment1), (aspect2, comment2), ... ]), ... ]
因此，在检索所需数据时，请使用嵌套的for循环组织操作。i、例如，一旦你找到一个方面，试着得到相应的注释并将它们存储在一起。逃避寻找所有方面，然后所有的评论
代码
这是一个演示
blocks = soup.find_all("div", {"class":"mod-reviewTop"}) contents = soup.find_all("div", {"class":"mod-reviewBottom"}) data = [] for i,block in enumerate(blocks): aspects = [] title = str(block.find('div',{'class':'mod-reviewTitle'}).text).strip() for aspect_block in contents[i].find_all('li'): aspect = str(aspect_block.find('div',{'class':'mod-reviewTitle3'}).text).strip() comment = str(aspect_block.find('div',{'class':'mod-reviewList-txt'}).text).strip() aspects.append((aspect,comment)) data.append((title,aspects)) print data with open("output.txt","w") as file: for title, aspects in data: file.write(title) for aspect in aspects: file.write('|'+aspect[0]+'\t'+aspect[1]) file.write('\n')

有些学生只对某些方面作了评论。他们不评论的方面不会在网站上显示

提示：

代码

相关问题更多 >

编程相关推荐

热门问题

热门文章