我试图访问一组行中的url,并从所有这些链接中获取各自的信息并将其存储在文本文件中。我把我的链接存储在一个文件-“ctp_输出.csv“ 目前我可以通过直接提供一个链接来提取信息。需要一些指导。在
import csv
import urllib2
from bs4 import BeautifulSoup
url = "http://www.thedrum.com/news/2015/07/29/mankind-must-get-ahead-technical-development-states-phds-mark-holden-following"
soup = BeautifulSoup(urllib2.urlopen(url))
with open('ctp_output.txt', 'w') as f:
for tag in soup.find_all('p'):
f.write(tag.text.encode('utf-8') + '\n')
下一步是打开csv文件,然后遍历每一行,提取每个链接的信息。你可以这样做:
可以使用
pandas.read_csv()
在pandas
数据帧中导入csv。 然后迭代数据帧的行,如下所示相关问题 更多 >
编程相关推荐