无法筛选图像的美化组结果

import httplib2 from BeautifulSoup import BeautifulSoup, SoupStrainer http = httplib2.Http() status, response = http.request('URL') for link in BeautifulSoup(response, parseOnlyThese=SoupStrainer('img')): if "visibility:hidden" not in link: print "IMAGE PATH: "+link['src']

2条回答

网友

1楼 · 编辑于 2024-04-26 01:22:45

谢谢梁先生。我也不得不换成bs4。在

import httplib2
from bs4 import BeautifulSoup, SoupStrainer

http = httplib2.Http()
status, response = http.request('URL')

for link in BeautifulSoup(response, 'html.parser', parse_only=SoupStrainer('img')):
    if 'style' in link.attrs:
        if "visibility:hidden" not in link['style']:
            print link['src']
    else:
        print link['src']

网友

2楼 · 编辑于 2024-04-26 01:22:45

使用tag.attrs首先获取标签上的属性，然后过滤属性。下面的代码可以工作。在

另外，你应该定义哪个解析器适合这种情况，这样会得到更好的结果。在

for link in BeautifulSoup(response, 'html.parser', parse_only=SoupStrainer('img')):
    if 'style' in link.attrs:
        if "visibility:hidden" not in link['style']:
            print link['src']
    else:
        print link['src']

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法筛选图像的美化组结果

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >