Попытка отказаться от JavaScript с PyQt4 - PullRequest
0 голосов
/ 26 ноября 2018

У меня проблемы с очисткой сайта для скачек, кажется, что он слишком быстро читает страницу и просто возвращает "loading ...."

Вот мой код:

import sys
from PyQt4.QtGui import QApplication
from PyQt4.QtCore import QUrl
from PyQt4.QtWebKit import QWebPage
import bs4 as bs
import urllib.request

class Client(QWebPage):
    def __init__(self, url):
        self.app = QApplication(sys.argv)
        QWebPage.__init__(self)
        self.loadFinished.connect(self.on_page_load)
        self.mainFrame().load(QUrl(url))
        self.app.exec_()

    def on_page_load(self):
        self.app.quit()

url = 'https://www.racenet.com.au/racing-form-guide/ballina-20181126/tab-com-au-maiden-plate-race-2/form'
client_response = Client(url)
source = client_response.mainFrame().toHtml()
soup = bs.BeautifulSoup(source, 'lxml')
js_test = soup.find('table', class_='form-table col-md-12')
print(js_test.text)

Выход:

Loading....
...