如何使用Python中的Beautiful Soup和遍历从网页中获取标题

2024-05-29 04:31:06 发布

男 | 程序猿一只，喜欢编程写python代码。

我在python中使用bs4来解析web页面并获取信息。我很难仅仅抓住标题。另一个我很纠结的部分是跟踪链接，这应该递归地完成还是通过循环来完成

def getTitle(link):
    resp = urllib.request.urlopen(link)
    soup = BeautifulSoup(resp, 'html.parser')
    print(soup.find("<title>"))

Tags： web 标题链接 request def html link 页面

1条回答

网友

1楼 · 发布于 2024-05-29 04:31:06

from bs4 import BeautifulSoup    
import urllib    

def getTitle(link):
    resp = urllib.request.urlopen(link)
    soup = BeautifulSoup(resp, 'html.parser')
    return soup.title.text

print(getTitle('http://www.bbc.co.uk/news'))

其中显示：

Home - BBC News

编程相关推荐

java这算是人工智能吗？
java@OnDelete（级联）不处理双向映射（hibernate）
java我怎样才能在基元类型（int）上修复这个等式
java如何初始化PrintWriter数组？
arraylist如何使用java添加敌人
java如何处理2019年的背景地理围栏？
java是否有一个XPath表达式可用于在CDATA区域中导航XML？
Kotlin（Android Studio）中的java选项卡式活动
安卓 java。lang.IllegalArgumentException:provider=网络
广播控制流和主流的java排序

热门问题

Django:。是不是“超级用户”字段不起作用
11 个回答
Django:'DeleteQuery'对象没有属性'add'
1 个回答
Django:'ModelForm'对象没有属性
2 个回答
Django:'python manage.py runserver'返回'TypeError:'WindowsPath'类型的对象没有len（）
7 个回答
Django:'Python管理.pysyncdb'不创建我的架构表
2 个回答
Django:'Python管理.py迁移“耗时数小时（和其他奇怪的行为）
3 个回答
Django:'readonly'属性在我的ModelForm上不起作用
4 个回答
Django:'RegisterEmployeeView'对象没有属性'object'
3 个回答
Django:'str'对象没有属性'get'
5 个回答
Django：'创建' 不能被指定为Order模型表单中的值，因为它是一个不可编辑的字段
3 个回答
Django:“'QuerySet'类型的对象不是JSON可序列化的”
1 个回答
Django:“'utf8'编解码器无法解码位置19983中的字节0xe9：无效的连续字节”，加载临时文件时
9 个回答
Django:“<…>”需要有一个字段“id”的值，然后才能使用这个manytomy关系
7 个回答
Django:“AnonymousUser”对象没有“get_full_name”属性
5 个回答
Django:“ascii”编解码器无法解码位置1035中的字节0xc3：序号不在范围内（128）
10 个回答
Django:“BaseTable”对象不支持索引
4 个回答
Django:“collections.OrderedDict”对象不可调用
6 个回答
Django:“Country”对象没有属性“all”
10 个回答
Django:“Data”对象没有属性“save”
3 个回答
Django:“datetime”类型的对象不是JSON serializab
7 个回答

如何使用Python中的Beautiful Soup和遍历从网页中获取标题

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用Python中的Beautiful Soup和遍历从网页中获取标题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >