Как очистить закрытую группу facebook, для которой у меня есть учетные данные, с помощью facebook_scraper - PullRequest
0 голосов
/ 29 мая 2020
• 1000 *, но не с частными группами , которые доступны для поиска (под возможностью поиска я имею в виду, что если вы не являетесь членом группы и вводите ее имя в панель поиска, она будет отображаться с некоторой информацией, но не сообщения или обсуждения, тогда как группы, не подлежащие поиску, не будут отображаться вообще, и если вы введете их конкретный c URL-адрес, вы будете перенаправлены на вход)

Я думаю, причина в том, что когда URL-адрес если введена группа, не подлежащая поиску, вы немедленно перенаправляетесь на страницу входа, и поэтому вход в систему работает, тогда как группы с возможностью поиска показывают некоторую информацию, а скребок просто очищает ее.

После репозитория GitHub для facebook-scraper Я думаю, что обнаружил проблему по адресу:

facebook_scraper.page_iterators.generic_iter_pages(url, GroupPageParser, FacbookScraper.get)

Проблема становится более очевидной по адресу:

facebook_scraper.page_iterators.GroupPageParaser(url).get_html().find('article')

Что возвращает пустой список, если группа доступна для поиска, и заполненный список, если это не так

Полный пример моей застопорившейся отладки с двумя фактическими группами I Я в:

>>> from facebook_scraper import FacebookScraper, page_iterators

>>> scraper = FacebookScraper()
>>> parser = page_iterators.GroupPageParser

>>> credentials = (myemail@email.com, mypassword)
>>> scraper.login(credentials[0], credentials[1]) #It's not a login problem except for with the searchable groups

>>> searchable_url = 'https://m.facebook.com/groups/1401745746503709'
>>> unsearchable_url = 'https://m.facebook.com/groups/618892088578525'

>>> searchable_get = scraper.get(seachable_url)
>>> unsearchable_get = scraper.get(unsearchable_url)

>>> searchable_html = parser(searchable_get).get_html()
>>> unsearchable_html = parser(unsearchable_get).get_html()

>>> searchable_get.html
<HTML url='https://m/facebook.com/groups/1401745746503709' #This stays the same
>>> unsearchable_get.html
<HTML url='https://m.facebook.com/groups/618892088578525?_rdr' #This url is changed to a redirection to login

>>> len(searchable_html.find('article'))
0
>>> len(unsearchable_html.find('article'))
21

Я пытаюсь понять это в python, я совсем не знаком с html, так что это было сложно. Любая помощь будет принята с благодарностью. Спасибо.

...