我正在尝试得到一个循环工作,它将从创建的数据框架中获取链接,并继续进行更多的报废。我做错什么了?源链接是否在循环中读取?
df = pd.DataFrame(columns = ['link'],data=[url.a.get('href') for url in soup.find_all('div',class_="link")])
for i in range(0,33):
link = df.iloc[i]
source1 = urllib.request.urlopen(link).read()
soup1 = bs.BeautifulSoup(source1,'lxml')
for username in soup1.find_all('div', class_="user-name"):
print(username.text)
代码的一个问题是从dataframe获取链接的方式。它应该是:
而不是
^{pr2}$因为后者返回一个
object
,而urlopen(link)
需要一个string
。如果提供了错误消息/stacktrace,我们将能够更好地猜测。在相关问题 更多 >
编程相关推荐