Как ползать IEEE - PullRequest
       28

Как ползать IEEE

0 голосов
/ 02 мая 2018

Я работаю над проектом, который должен сканировать веб-сайт IEEE. Я использую BeautifulSoup, чтобы выполнить это. Вот мой код:

import bs4 as bs
import sys
from PyQt5.QtWidgets import QApplication
from PyQt5.QtCore import QUrl
from PyQt5.QtWebKitWidgets import QWebPage

class Client(QWebPage):
    def __init__(self, url):
        self.app = QApplication(sys.argv)
        QWebPage.__init__(self)
        self.loadFinished.connect(self.on_page_load) 
        self.mainFrame().load(QUrl(url))
        self.app.exec_()

    def on_page_load(self):
        self.app.quit() 

url = 'https://ieeexplore.ieee.org/Xplore/home.jsp'
client_response = Client(url)
source = client_response.mainFrame().toHtml() # capture what browser show
soup = bs.BeautifulSoup(source, 'lxml')
for e in soup.find('div'):
    print(e.text)

Однако после выполнения этого набора кодов консоль показывает, что она работает но ничего не отвечает мне (консоль все еще работает).

Можете ли вы помочь мне исправить это?

Заранее спасибо

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...