如何使用webkit + gtk 获取网页中的标题和脚本?

1 投票
2 回答
1162 浏览
提问于 2025-04-16 06:12


这是我的代码片段

import gtk, webkit
window = gtk.Window()
browser = webkit.WebView()
url = "www.google.com"
browser.open(url)

现在我想获取网页的标题,以及里面的脚本标签。我该怎么做呢?

文档在这些地方不太清楚,我只找到了一些关于Objective-C的资料,而我正在努力寻找解决办法。如果你知道哪里有更好的参考资料,不一定是Python的,C或C++的资料也可以。

谢谢

2 个回答

0

这和用什么技术来获取HTML没有关系。一旦浏览器打开了网页,你就可以用像Beautiful Soup这样的工具,或者任何支持XPath的工具来解析HTML。

1

我觉得下面的代码应该可以用(我现在没法试一下):

def title_changed(widget, frame, title):
    print title

browser.connect('title-changed', title_changed)

这里有一些文档,可以参考一下:这个链接这个链接,还有源代码包里的演示目录里有两个例子。

撰写回答