Соскребание против Google Trends API с использованием Python - PullRequest
0 голосов
/ 08 апреля 2020

Я пытаюсь собрать пять лучших поисковых запросов для каждого тренда за последний год по категориям в Google Trends.

Я не знаю, стоит ли мне это делать с помощью библиотеки python, такой как pytrends, который из их документов требует ключевое слово для запроса GT, или у меня нет никакого конкретного c ключевого слова, я хочу получить любой поисковый запрос для термина в каждой категории, которая может быть найдена.

Используйте библиотеку утилизации Selenium или Beautifulsoup4 для сбора этой информации непосредственно с веб-сайта GT .

Цель этого состоит в том, чтобы иметь возможность чтобы получить 5 лучших веб-сайтов для каждого запроса позже ...

В каком направлении мне идти?

1 Ответ

1 голос
/ 14 апреля 2020

Лучше использовать один из неофициальных API.

Они подключаются к внутренним API Google, которые снабжают пользовательский интерфейс Trends структурированной информацией. Но очистка вернет только неструктурированные данные HTML, и вам придется извлечь структурированные данные самостоятельно. Эта информация не будет настолько надежной или полной.

Разница между разговором через API, предназначенный для связи «машина-машина», и веб-интерфейсом, предназначенным для «машина-человек» взаимодействия.

...