我正试图从网站上提取数据 http://maps.jocogov.org/ims/
在这个网站上有一个搜索选项,在这个搜索选项中,我想获得与特定属性id对应的信息,比如DP14000001 0001
当我们搜索属性id时,会出现一个弹出窗口,从该窗口中,我需要从“税单信息单击此处”链接提取数据
我将属性ID存储在文本文件中,这样ID就可以从那里插入并用于搜索选项,并从弹出窗口中的链接中获取数据
我是新的网页抓取和写了一些启动代码
import re
import urllib
propertyids = "/home/NewYork/PropertyId.txt"
url = "http://maps.jocogov.org/ims/"
htmlfile = urllib.urlopen(url)
htmltext = htmlfile.read()
regex = 'class="ui-autocomplete-input" type="+propertyids+"'
pattern = re.compile(regex)
locationidinfo = re.findall(pattern,htmltext)
print locationidinfo
在执行了这个代码之后,我得到了这样的结果[],不知道它是什么意思。所以我迷失在设置进一步的代码从网站获取数据
有人能帮忙进一步吗
提前感谢!!:)
目前没有回答
相关问题 更多 >
编程相关推荐