Python解析出BeautifulSoup findAll in

2024-04-23 09:31:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经尝试修复这个web scraper有一段时间了,但仍然找不到如何解析findAll函数中的信息。我现在正试图通过网络搜索纳斯达克,纳斯达克的每只股票都有一张股票信息表。表的第一部分,文本部分,在我的python上完美呈现。但是,当我试图获取表的数字侧的信息时,得到的结果是:'\r\n 120\r\n'。号码在里面,但我不知道怎么把它和其他信息分开。如果你感兴趣的话,这是我剩下的代码

from urllib.request import urlopen as ureq
from bs4 import BeautifulSoup as soup

my_url = 'https://www.nasdaq.com/symbol/msft'
uClient = ureq(my_url)

page_html = uClient.read()
uClient.close()
page_soup = soup(page_html, "html.parser")
containers = page_soup.findAll("div",{"class":"table-cell"})
bidask = containers[8]
bidasktitle = bidask.b.text

bidaskvalue = containers[9]
bidaskvaluetitle = bidaskvalue.text

yeartarget = containers[10]
yeartargettitle = yeartarget.b.text

yeartargetvalue = containers[11]
yeartargetvaluetitle = yeartargetvalue.text

Tags: textfromimport信息urlmyhtmlas
2条回答

使用strip()会对您有更多帮助,例如:

yeartargetvaluetitle = yeartargetvalue.text.strip()

strip()是一个非常有用的函数,当你处理你需要的数据时,关于strip

利用正则表达式从字符串中过滤出数字

preg_replace('/[^0-9]/', '', $string);

相关问题 更多 >