尝试获取标签值时未返回任何值

class BotStreamer(tweepy.StreamListener): print "Bot Streamer" #on_data method of Tweepy’s StreamListener #passes data from statuses to the on_status method def on_status(self, status): print "on status" link = 'https://letterboxd.com/shesnicky/list/top-50-favourite-films/' page = requests.get(link) soup = BS(page.content, 'html.parser') movies_ul = soup.find('ul', {'class':'poster-list -p125 -grid film-list'}) movies = [] for mov in movies_ul.find('data-film-slug'): movies.append(mov) rand = randint(0,51) newLink = "https://letterboxd.com%s" % (str(movies[rand])) newPage = requests.get(newLink) code = BS(newPage.content, 'html.parser') code_div = code.find\ ('div', {'class':'react-component film-poster film-poster-51910 poster'}) image = code_div.find('img') url = image.get('src') username = status.user.screen_name status_id = status.id tweet_reply(url, username, status_id)

import requests from bs4 import BeautifulSoup as BS link = 'https://letterboxd.com/shesnicky/list/top-50-favourite-films/' page = requests.get(link) soup = BS(page.content, 'html.parser') movies_ul = soup.find('ul', {'class':'poster-list -p125 -grid film-list'}) more = movies_ul.find('li', {'class':'poster-container numbered-list-item'}) k = more.find('data-target-link') print k

1条回答

网友

1楼 · 发布于 2024-05-13 03:36:29

读取doc:find()，因为第一个参数需要标记名，而不是属性。你知道吗

你可以这样做

soup.find('div', {'data-target-link': True})

或者

soup.find(attrs={'data-target-link': True})

完整示例

import requests
from bs4 import BeautifulSoup as BS

link = 'https://letterboxd.com/shesnicky/list/top-50-favourite-films/'
page = requests.get(link)
soup = BS(page.content, 'html.parser')

all_items = soup.find_all('div', {'data-target-link': True})

for item in all_items:
    print(item['data-target-link'])

相关问题更多 >

编程相关推荐

热门问题

热门文章