Ошибка для введенного JavaScript (Python Web Scraper) - PullRequest
1 голос
/ 29 мая 2011

Ранее у меня была похожая проблема, но я не могу понять, почему она не позволяет мне установить флажок.Я ВЕРЮ, что я делаю ошибку, проверяя флажок, выбрав его неправильным способом.

Вот мой след:

Traceback (most recent call last):
  File "C:\Python27\Sample Programs\Spynner Basic.py", line 19, in <module>
    br.check('input[name="AdvSearchView$SRView$_resultGrid$ctl01$chk"]')
  File "C:\Python27\lib\site-packages\spynner\browser.py", line 846, in check
    self._runjs_on_jquery("check", jscode)
  File "C:\Python27\lib\site-packages\spynner\browser.py", line 394, in _runjs_on_jquery
    raise SpynnerJavascriptError("error on %s: %s" % (name, code))
SpynnerJavascriptError: error on check: jq('input[name="AdvSearchView$SRView$_resultGrid$ctl01$chk"]').attr('checked', true)

Вот раздел HTML / CSS:

<tr>
<td align="left" style="width: 100%; vertical-align: top; background-color: #ffffff; height: 100%">
<table id="AdvSearchView_SRView__resultGrid" cellspacing="0" border="0" style="border-width:0px;width:100%;border-collapse:collapse;" rules="cols">
<tbody>
<tr class="columnheader">
<td align="center" style="width:20px;FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">
<span title="Select/Deselect All">
<input id="AdvSearchView_SRView__resultGrid_ctl01_chk" type="checkbox" onclick="javascript:ResultGrid.checkUncheckAll('AdvSearchView_SRView__resultGrid', this);"     name="AdvSearchView$SRView$_resultGrid$ctl01$chk"> # THIS IS THE IMPORTANT PART I THINK
</span>
</td>
<td align="center" style="width:25px;FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">Type</td>
<td align="left" style="FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;WHITE-SPACE:NOWRAP;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','DisplayTicker',null);">Ticker</a>
</td>
<td align="center" style="FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;WHITE-SPACE:NOWRAP;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','Date',null);">Date</a>
<img style="border-width:0px;" src="/thomson_financial_research_web_ui/3_19/Images/sort_desc.jpg">
</td>
<td align="left" style="FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','Title',null);">Headline    </a>
</td>
<td align="right" style="FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','Pages',null);">Pgs</a>
</td>
<td align="left" style="width:180px;FONT-SIZE:70%;BORDER-BOTTOM:solid 1px;PADDING-BOTTOM:3px;">
<a href="javascript:callback.doCallback('AdvSearchView$SRView$_sortingHeaders','Contributor',null);">Contributor</a>
</td>
</tr>

А вот мой код Python:

from __future__ import division
from __future__ import unicode_literals
from __future__ import print_function
import re
import spynner
from BeautifulSoup import BeautifulSoup
import time
br = spynner.Browser()
br.create_webview()
br.show()
br.set_html_parser("BeautifulSoup")
br.load("https://www.thomsononeim.com/s-log_in.asp")
br.fill("input[name=txtLoginID]", "username")
br.fill("input[name=txtPWD]", "password")
br.click("input[name=Submit]", wait_load=True)
br.click("input[name=Market]", wait_load=True)
br.select('option[value="IBESNA~US"]')
br.click("#MktGoImg", wait_load=True)
br.check('input[name="AdvSearchView$SRView$_resultGrid$ctl01$chk"]')
br.browse()
br.close()

Ответы [ 2 ]

0 голосов
/ 04 июня 2011

Я могу ошибаться, но я думаю, что это настоящая ошибка. Вы должны сообщить об этом Киорки. Я скопировал ваш HTML в локальный документ и запустил ваш код (и его варианты).

Если вы включите отладку, вы увидите это:

Javascript console (undefined:1): ReferenceError: Can't find variable: jq
Javascript console (undefined:1): ReferenceError: Can't find variable: jq

Что не имеет никакого смысла вообще. Это переменная, определяемая спиннером, почему она не существует?

Если вы попробуете:

browser.load('http://www.lehigh.edu/~inwww/form-test.html')
browser.uncheck('input[type=checkbox]')
browser.check('input[type=checkbox]')

работает просто замечательно.

Чтобы получить больше информации об отладке, выполните:

browser.debug_level = spynner.INFO

Проверьте API или исходный код, какие другие опции уровня отладки у вас есть. Возможно, я далек от истины, так что, может быть, кто-то еще может пролить свет на это?

EDIT:

Если вы добавите это в исходный HTML-код:

<script type="text/javascript" src="http://ajax.googleapis.com/ajax/libs/jquery/1.5.2/jquery.min.js"></script>

это работает. Похоже, что jquery введен неправильно (что должно быть в соответствии с документацией).

0 голосов
/ 30 мая 2011

Я считаю, что это связано с неправильным названием селектора.

...