Python从html页面重新排列并删除字符

import urllib2 import re from bs4 import BeautifulSoup soup = BeautifulSoup(urllib2.urlopen("http://www.daisuki.net/us/en/anime/watch.GUNDAMUNICORNRE0096.13142.html"), "lxml") Name = soup.title.string print(Name.replace('#', ""))

2条回答

网友

1楼 · 编辑于 2024-05-15 14:35:06

黑客解决方案：

Name = "01 DEPARTURE 0096 - MOBILE SUIT GUNDAM UNICORN RE:0096 - DAISUKI"
print ("- ".join(reversed(Name.split('-')[:2]))).strip()

网友

2楼 · 编辑于 2024-05-15 14:35:06

按-拆分并重新排列标题部分：

>>> import urllib2
>>> from bs4 import BeautifulSoup
>>> 
>>> soup = BeautifulSoup(urllib2.urlopen("http://www.daisuki.net/us/en/anime/watch.GUNDAMUNICORNRE0096.13142.html"), "lxml")
>>> Name = soup.title.string
>>> 
>>> " - ".join(Name.replace('#', "").split(" - ")[1::-1])
u'MOBILE SUIT GUNDAM UNICORN RE:0096 - 01 DEPARTURE 0096'

编程相关推荐

用于切换状态结果的枚举的java输入
检测*NIX上打开的端口时出现java问题
java捕获和保存屏幕截图
java SLF4JLogback：基于日志级别的多模式
Java从字符串中删除动态子字符串
在spring引导中contextLoads测试时运行java Liquibase
基于规则集的任意嵌套POJO的java任意就地转换
java如何做，边做边循环这段代码？
java是什么导致jmh测量中的错误？
java Spring RabbitTemplate执行方法可见性

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python从html页面重新排列并删除字符

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >