将html2text与html utf8一起使用

2024-06-12 21:46:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我对html2text有问题

input = "<h1 itemprop="name">B&#242; 33 M&#243;n</h1>"

我使用

^{pr2}$

我的结果呢

B 33 Mn

我需要的结果

Bò 33 món

我该怎么做?在


Tags: nameinputh1mnitemprophtml2textpr2
1条回答
网友
1楼 · 发布于 2024-06-12 21:46:09

html2text(input)的结果是Unicode。要使用print打印它,需要将其转换为UTF-8,使其返回到每字符8位:

from stripogram import html2text
print html2text(input).encode('utf-8')

会打印出来的

# Bò 33 Món

相关问题 更多 >