用BeautifulSoup（或者更确切地说是xpath）解析span类

try: page = requests.get(Scrape.site_to_scrape['git']+gitUser) tree = urllib.urlopen(page).read() soup = BS(response) parse_git_full_name = soup.find("span", {"class":"vcard-fullname"}).get_text() return parse_git_full_name except: print "Syntax: python site_scrape.py -g <git user name here>"

1条回答

网友

1楼 · 发布于 2024-04-16 22:40:32

而是使用带有单个选择器的xpath来解决这个问题。希望这能帮助其他人通过beautifulsoup选择器把头发拔出来。你知道吗

try:
    page = requests.get(Scrape.site_to_scrape['git']+gitUser)
    tree = html.fromstring(page.text)

    full_name = tree.xpath('//span[@class="vcard-fullname"]/text()')

    print 'Full Name: ', full_name

except:
    print "Syntax: python site_scrape.py -g <git user name here>"

编程相关推荐

用于斜体标记的java正则表达式
java正在部署Play 2.3。Windows Azure上的X应用程序
java Hazelcast与云节点失去连接
如何使用SeleniumWebDriverJava获取css中定义的%元素的高度或宽度
java在使用printwriter时删除新行
java如何在Spring应用程序中获取ServletConfig？
java存在应用程序最大代码数的问题
java电子邮件类型必须实现继承的抽象方法。比较（对象）
sql安全在Oracle中将DB数据作为Java字符串进行比较？
java如何在JLabel中使ImageIcon的背景透明

相关问题更多 >

编程相关推荐

热门问题

热门文章

用BeautifulSoup（或者更确切地说是xpath）解析span类

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >