Python解析出BeautifulSoup findAll in

2024-04-23 09:31:49 发布

男 | 程序猿一只，喜欢编程写python代码。

我已经尝试修复这个web scraper有一段时间了，但仍然找不到如何解析findAll函数中的信息。我现在正试图通过网络搜索纳斯达克，纳斯达克的每只股票都有一张股票信息表。表的第一部分，文本部分，在我的python上完美呈现。但是，当我试图获取表的数字侧的信息时，得到的结果是：'\r\n 120\r\n'。号码在里面，但我不知道怎么把它和其他信息分开。如果你感兴趣的话，这是我剩下的代码

from urllib.request import urlopen as ureq
from bs4 import BeautifulSoup as soup

my_url = 'https://www.nasdaq.com/symbol/msft'
uClient = ureq(my_url)

page_html = uClient.read()
uClient.close()
page_soup = soup(page_html, "html.parser")
containers = page_soup.findAll("div",{"class":"table-cell"})
bidask = containers[8]
bidasktitle = bidask.b.text

bidaskvalue = containers[9]
bidaskvaluetitle = bidaskvalue.text

yeartarget = containers[10]
yeartargettitle = yeartarget.b.text

yeartargetvalue = containers[11]
yeartargetvaluetitle = yeartargetvalue.text

Tags： text from import 信息 url my html as

2条回答

网友

1楼 · 编辑于 2024-04-23 09:31:49

使用strip()会对您有更多帮助，例如：

yeartargetvaluetitle = yeartargetvalue.text.strip()

strip（）是一个非常有用的函数，当你处理你需要的数据时，关于strip

网友

2楼 · 编辑于 2024-04-23 09:31:49

利用正则表达式从字符串中过滤出数字

preg_replace('/[^0-9]/', '', $string);

Python解析出BeautifulSoup findAll in

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python解析出BeautifulSoup findAll in

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >