Python中文
首页
教程
问答
标签
搜索
登录
注册
BeautifulSoup.text方法返回不带分隔符的文本(\n、\r等)
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我试图解析来自俄罗斯最大歌词网站<a href="http://amalgama-lab.com" rel="noreferrer">http://amalgama-lab.com</a>的歌词,并将歌词(翻译和原始)保存到Vkontakte帐户的音频列表中(遗憾的是,amalgama没有任何API)</p> <pre><code>import urllib from BeautifulSoup import BeautifulSoup import vkontakte vk = vkontakte.API(token=<SECRET_TOKEN>) audios = vk.getAudios(count='2') #{u'artist': u'The Beatles', u'url': u'http://cs4519.vkontakte.ru/u4665445/audio/4241af71a888.mp3', u'title': u'Yesterday', u'lyrics_id': u'2365986', u'duration': 130, u'aid': 166194990, u'owner_id': 173505924} url = 'http://amalgama.mobi/songs/' for i in audios: print i['artist'] if i['artist'].startswith('The '): url += i['artist'][4:5] + '/' + i['artist'][4:].replace(' ', '_') + '/' +i['title'].replace(' ', '_') + '.html' else: url += i['artist'][:1] + '/' + i['artist'].replace(' ', '_') + '/' +i['title'].replace(' ', '_') + '.html' url = url.lower() page = urllib.urlopen(url) soup = BeautifulSoup(page.read(), fromEncoding="utf-8") texts = soup.findAll('ol', ) if len(texts) != 0: en = texts[0].text #this! ru = texts[1].text #this! vk.get('audio.edit', aid=i['aid'], oid = i['owner_id'], artist=i['artist'], title = i['title'], text = ru, no_search = 0) </code></pre> <p>但是.text方法返回字符串<em>而不返回任何分隔符:</p> <p>“昨天,我所有的烦恼似乎都离我太远了,看起来好像它们都在这里等待着我,我相信昨天突然,我不再是以前的一半了,有一个阴影笼罩着我,昨天突然来了[合唱:]为什么她要走我不知道,她不会说我说错了什么,现在我渴望昨天,爱是这样的一个简单的游戏现在我需要一个藏身的地方,我相信</p> <p>这是主要问题。接下来,有什么更好的方法来保存这样的歌词:</p> <p>歌词第1行(原件)</p> <p>歌词第1行(翻译)</p> <p>歌词第2行(原文)</p> <p>歌词第2行(翻译)</p> <p>歌词第三行(原文)</p> <p>歌词第三行(翻译)</p> <p>。。。</p> <p>是吗?我只得到混乱的代码。谢谢</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我建议你调查一下<a href="http://www.crummy.com/software/BeautifulSoup/bs4/doc/#strings-and-stripped-strings" rel="noreferrer">the .strings generator found in Beautiful Soup 4</a>。</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
创建一个python程序,从websi中提取文件
8 回答
创建一个python程序,告诉我名字和出生年份的人的年龄
5 回答
创建一个Python程序,它接受一个简短的描述并从给定的集合返回一个解决方案(使用nlp)
3 回答
创建一个python程序,用户在其中输入一个月,它会告诉您y的下一个月
1 回答
创建一个python程序,要求用户输入一个偶数奇数
8 回答
创建一个Python程序来修改名称以digi结尾的目录的文本文件
2 回答
创建一个python程序来猜测用户的“秘密号码”?
4 回答
创建一个python算法来训练keras模型来预测一个大的整数序列
10 回答
创建一个python类,它被视为一个列表,但是有更多的特性?
8 回答
创建一个Python类,我可以将其序列化为一个嵌套的JSON obj
2 回答
创建一个python类来查找直线的斜率和长度
9 回答
创建一个Python网络爬虫来获取谷歌Play商店应用程序的元数据
6 回答
创建一个Python网页
1 回答
创建一个python脚本,不断从excel文件中读取数据并进行计算
6 回答
创建一个python脚本,使用tcpdump计算到达网站的数据包数量?
7 回答
创建一个Python脚本,可以运行其他SAS程序并更新Excel工作簿。
7 回答
创建一个python脚本,它将读取csv文件,并使用该输入从web抓取数据finviz.com网站然后将数据导出到csv fi中
10 回答
创建一个python脚本,用mysql数据库中的结构和数据文件创建一个sql转储
9 回答
创建一个python脚本,该脚本将对某个键进行文本文件搜索,并将编号复制到新文件中
5 回答
创建一个Python脚本,该脚本连接到特定端口(SMTP)上的一系列IP
3 回答