Как войти на сайт и очистить с помощью Python 3 - PullRequest
0 голосов
/ 30 ноября 2018

Я хотел бы войти в мессенджер Facebook и разобрать HTML.

import requests
from bs4 import BeautifulSoup
import webbrowser
page = requests.get("https://www.messenger.com", auth=
('username', 'password'))

soup = BeautifulSoup(page, 'html.parser')

print(soup)

Я получил это из другого вопроса стека, но он выдает мне эту ошибку:

    File "C:/Code/Beautiful Soup Web Scraping.py", line 7, in <module>
    soup = len(BeautifulSoup(page, 'html.parser'))
  File "C:\Users\Ethan\AppData\Local\Programs\Python\Python37\lib\site-packages\bs4\__init__.py", line 246, in __init__
    elif len(markup) <= 256 and (
TypeError: object of type 'Response' has no len()

Как я могу заставить это работать?

Ответы [ 2 ]

0 голосов
/ 01 декабря 2018

Я бы порекомендовал использовать Selenium, что позволит вам войти в Facebook, перейти на нужную страницу и получить html.Затем вы можете передать HTML-код на BeautifulSoup.Посмотрите на это сообщение в блоге , чтобы начать.

0 голосов
/ 30 ноября 2018

Вы должны передать BeautifulSoup содержимое веб-страницы, а не объект Response, возвращаемый requests.get.Чтобы получить контент, используйте свойство Response.content.

В вашем примере используйте: soup = BeautifulSoup(page.content, 'html.parser')

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...