Question

Я пытаюсь получить данные с этой веб-страницы https://playruneterra.com/es-es/news, и часть, которую я пытаюсь получить, такова:

Я использую BeatufulSoup, чтобы получить html и выполнить поиск по нему, но когда я использовал метод findAll, чтобы получить эту строку, он возвращает мне пустой массив. Я пробовал то же самое на других страницах, и это прекрасно работает. Что происходит?

Это мой код:

Это пример работающего:

Спасибо всем.

Hassaan Ali · Answer 1 · 02 мая 2020

Вы можете использовать PyQt для создания браузера без головы, а затем удалить данные с веб-сайта. Вот демо-код для вас:

import bs4 as bs
import sys
import urllib.request
from PyQt5.QtWebEngineWidgets import QWebEnginePage
from PyQt5.QtWidgets import QApplication
from PyQt5.QtCore import QUrl

class Page(QWebEnginePage):
    def __init__(self, url):
        self.app = QApplication(sys.argv)
        QWebEnginePage.__init__(self)
        self.html = ''
        self.loadFinished.connect(self._on_load_finished)
        self.load(QUrl(url))
        self.app.exec_()

    def _on_load_finished(self):
        self.html = self.toHtml(self.Callable)
        print('Load finished')

    def Callable(self, html_str):
        self.html = html_str
        self.app.quit()


def main():
    page = Page('https://playruneterra.com/es-es/news')
    soup = bs.BeautifulSoup(page.html, 'html.parser')
    js_test = soup.find('h2', class_='heading-03 src-component-content-NewsItem-___NewsItem-module__title___3OcDj')
    print(js_test.text)

if __name__ == '__main__': main()

sharan sharma · Answer 2 · 02 мая 2020

первый щелчок правой кнопкой мыши и go для просмотра исходной страницы и поиска по ключевому слову, которое вы ищете, если вы можете найти там свой контент, то вы можете использовать суп над ним или же вы можете использовать селен

А в случае супа просто обернуть имена классов в формате dict

title = soup.findAll('h2',{'class':'add your full classes here'})

Błotosmętek · Answer 3 · 02 мая 2020

Второй параметр для findAll должен быть dict, а не строкой.

BeatifulSoup findAll возвращает пустой массив (python)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

BeatifulSoup findAll возвращает пустой массив (python)

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов