我得到了一个像标题这样的错误。在
Traceback (most recent call last):
File "C:/2.py", line 40, in <module>
reviews.append(reviews_info(div))
File "C:/2.py", line 21, in reviews_info
review_text = div.find("div", "review-content").div.text
AttributeError: 'NoneType' object has no attribute 'div'
我想我可能输入了错误的元素。在
我不是从头开始写代码的。我已经应用到以前爬网其他网站的代码。在
我怎样才能改变元素并转动它?? 我觉得我写得很好。但是有一个错误。在
ps恐怕会有评论使用api。但这是使用它的方式,因为它是有限的。在
^{pr2}$
在for循环中,已经向
reviews_info
传递class属性为“review content”的div。所以你最好去掉.find("div", "review-content")
部分。这可能是导致错误的原因。在显然,你需要复习的日期和星星。在
与使用
div.div.text
来提取日期不同,您可以使用包含日期的span
标记,如下所示:用于提取评级的表达式将引发另一个错误。在
“i-stars i-stars常规-1评级-大”适用于1星评级。所以4星评级应该是},以此类推。在
div
和{因此,您可以使用regex过滤包含评级的
^{pr2}$div
:将这两部分放在一起,您的
reviews_info
函数中需要更改的两行代码是:做出这些改变,你就可以走了。在
额外信息:
我没有使用
div.span.text.strip()
来提取文本的原因是,如果评论在发布后被更新,span
标签也包含了这个细节。使用span.text
也提取了这些信息。因此,我选择了next_element
。在免责声明:我仅在第三页测试了它,对我很有用。我不确定其他页面是否可以正常工作。在
相关问题 更多 >
编程相关推荐