我正在使用Jupyter Notebook获取docid=PE209374738作为我使用reg ex的输出。它当前以以下格式存储在字典中:
{'Url': 'https://backtoschool.com/document.php?docid=PE209374738&datasource=PHE&vid=3326&referrer=api'}
这是我的密码:
results= xmldoc.getElementsByTagName("result")
dict= {}
for a in results:
url= 'Url'
dict[url] = a.getElementsByTagName("url")[0].childNodes[0].nodeValue
docid= re.search(r'\?(.*?)&')
有人对如何打印身份证有什么建议吗
标准库已经有了正确解析url的方法,不需要regex
在Python 3中:
在Python 2中,第一行是:
@alex hall是正确的,您可能最好使用适当的URL解析器来解析它
也就是说,您最初的问题是关于如何使用regexps,所以下面是解决方案(您几乎已经确定了):
这将打印所需的
PE209374738
相关问题 更多 >
编程相关推荐