我试图从<li>
标记中提取日期并将它们存储在Excel文件中。在
<li>January 13, 1991: At least 40 people <a href ="......."> </a> </li>
代码:
^{pr2}$错误:
Traceback (most recent call last):
File "C:\Users\sony\Desktop\Trash\Crawler Try\trytest.py", line 13, in <module>
soup =BeautifulSoup(li[count])
File "C:\Python27\lib\site-packages\bs4\__init__.py", line 161, in __init__
markup = markup.read()
TypeError: 'NoneType' object is not callable
[Finished in 4.0s with exit code 1]
我不知道如何写excel中提取的每一个文本。没有包括代码。参考问题:Web crawler to extract in between the list
问题是-有一些不相关的
li
标记不包含您需要的数据。在更具体一点。例如,如果您想获得“20世纪”事件的列表,请首先找到标题并从其父级的following ^{} sibling 获取事件列表。此外,并非列表中的每个项目都有
%B %d, %Y
格式的日期-您需要通过try/except
块来处理它:印刷品:
^{pr2}$更新版本(获取所有低于一个世纪的ul组):
相关问题 更多 >
编程相关推荐