TypeError：需要字符串或字节，如obj

2024-06-06 18:46:06 发布

男 | 程序猿一只，喜欢编程写python代码。

我编写了一个script来解析html并只打印文本内容。我想忽略这些标签。但我的程序有问题。我不知道是什么。请帮帮我。

import urllib.request
import re
from bs4 import BeautifulSoup
url = "www.example.com"

def hi():
    dep = urllib.request.urlopen(url)
    soup = BeautifulSoup(dep, 'html.parser')
    for link in soup.find_all('p', string=True):
        result = re.sub(b'<.*?>', "", link)
        print (result)
hi()

网站link。

Tags：文本 import re url 内容 request html link

1条回答

网友

1楼 · 发布于 2024-06-06 18:46:06

我相信，在link变量中有NavigableString。

强制将其转换为字符串，如下所示：

for link in soup.find_all('p', string=True):
    result = re.sub(b'<.*?>', "", str(link))
    print (result)

TypeError：需要字符串或字节，如obj

相关问题更多 >

编程相关推荐

热门问题

热门文章

TypeError：需要字符串或字节，如obj

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >