注入的JavaScript错误(Python网络爬虫)
我之前遇到过类似的问题,但我搞不清楚为什么我不能点击这个复选框。我觉得我在选择复选框的时候可能犯了错误。
这是我的错误信息:
Traceback (most recent call last):
File "C:\Python27\Sample Programs\Spynner Basic.py", line 19, in <module>
br.check('input[name="AdvSearchView$SRView$_resultGrid$ctl01$chk"]')
File "C:\Python27\lib\site-packages\spynner\browser.py", line 846, in check
self._runjs_on_jquery("check", jscode)
File "C:\Python27\lib\site-packages\spynner\browser.py", line 394, in _runjs_on_jquery
raise SpynnerJavascriptError("error on %s: %s" % (name, code))
SpynnerJavascriptError: error on check: jq('input[name="AdvSearchView$SRView$_resultGrid$ctl01$chk"]').attr('checked', true)
这是我的HTML/CSS部分:
<tr>
<td align="left" style="width: 100%; vertical-align: top; background-color: #ffffff; height: 100%">
<table id="AdvSearchView_SRView__resultGrid" cellspacing="0" border="0" style="border-width:0px;width:100%;border-collapse:collapse;" rules="cols">
<tbody>
<tr class="columnheader">
<td align="center" style="width:20px;FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">
<span title="Select/Deselect All">
<input id="AdvSearchView_SRView__resultGrid_ctl01_chk" type="checkbox" onclick="javascript:ResultGrid.checkUncheckAll('AdvSearchView_SRView__resultGrid', this);" name="AdvSearchView$SRView$_resultGrid$ctl01$chk"> # THIS IS THE IMPORTANT PART I THINK
</span>
</td>
<td align="center" style="width:25px;FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">Type</td>
<td align="left" style="FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;WHITE-SPACE:NOWRAP;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','DisplayTicker',null);">Ticker</a>
</td>
<td align="center" style="FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;WHITE-SPACE:NOWRAP;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','Date',null);">Date</a>
<img style="border-width:0px;" src="/thomson_financial_research_web_ui/3_19/Images/sort_desc.jpg">
</td>
<td align="left" style="FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','Title',null);">Headline </a>
</td>
<td align="right" style="FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','Pages',null);">Pgs</a>
</td>
<td align="left" style="width:180px;FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','Contributor',null);">Contributor</a>
</td>
</tr>
这是我的Python代码:
from __future__ import division
from __future__ import unicode_literals
from __future__ import print_function
import re
import spynner
from BeautifulSoup import BeautifulSoup
import time
br = spynner.Browser()
br.create_webview()
br.show()
br.set_html_parser("BeautifulSoup")
br.load("https://www.thomsononeim.com/s-log_in.asp")
br.fill("input[name=txtLoginID]", "username")
br.fill("input[name=txtPWD]", "password")
br.click("input[name=Submit]", wait_load=True)
br.click("input[name=Market]", wait_load=True)
br.select('option[value="IBESNA~US"]')
br.click("#MktGoImg", wait_load=True)
br.check('input[name="AdvSearchView$SRView$_resultGrid$ctl01$chk"]')
br.browse()
br.close()
2 个回答
0
我可能说错了,但我觉得这真的是个bug。你应该把这个问题报告给Kiorky。
我把你的html复制到本地文档里,然后运行了你的代码(还有一些变种)。
如果你开启调试功能,你会看到这个:
Javascript console (undefined:1): ReferenceError: Can't find variable: jq
Javascript console (undefined:1): ReferenceError: Can't find variable: jq
这根本没有什么意义。这是一个spynner定义的变量,为什么它不存在呢?
如果你试试:
browser.load('http://www.lehigh.edu/~inwww/form-test.html')
browser.uncheck('input[type=checkbox]')
browser.check('input[type=checkbox]')
那就能正常工作了。
想要获取更多调试信息,可以这样做:
browser.debug_level = spynner.INFO
查看api或源代码,看看你还有哪些调试级别的选项。
我可能离真相很远,所以也许其他人能对此提供一些帮助?
编辑:
如果你在源html中添加这个:
<script type="text/javascript" src="http://ajax.googleapis.com/ajax/libs/jquery/1.5.2/jquery.min.js"></script>
那就能正常工作。看起来jquery没有被正确注入(根据文档应该是要注入的)。
0
我觉得这可能是因为选择器上的名字写错了。