我正在写一个程序,它从有新闻文章的网页上收集数据(标题、作者、文章)。我使用可读性Python库。我的问题是文章的内容(哪个程序)(如果文章是用西里尔文写的,如果文章是用拉丁文写的就可以了)有这样的格式:
{'atricle': u'<div><div class="b-text clearfix">\n<p class="b- topic__announce">'С';'о';'р';'о';'к'; 'о';'д';'и';'н'; 'п';'р';'о';'ц';'е';'н';'т'; 'р';'о';'с';'с';'и';'я';'н';'C'....
不带“'”
如何让它可读?你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐