Я пытаюсь написать программу на Python для сбора данных из Google Trends (GT) - в частности, я хочу автоматически открывать URL-адреса и получать доступ к определенным значениям, отображаемым в линейных графиках:
Я был бы рад загрузить CSV-файлы или просмотреть значения в Интернете (исходя из моего чтения Inspect Element, очистка данных потребует только простого разделения или двух).У меня много поисков, которые я хочу провести (много разных ключевых слов)
Я создаю много URL-адресов для сбора данных из Google Trends.Я использовал реальный URL из тестового поиска.Пример URL: https://trends.google.com/trends/explore?q=sports%20cars&geo=US При физическом поиске этого URL в браузере отображается соответствующая страница GT.Проблема возникает, когда я пытаюсь получить к ней доступ через программу.
Большинство ответов, которые я видел, предлагают использовать общедоступные модули из Pip (например, PyTrends и «Неофициальный API Google Trends») - мой менеджер проекта настоял, чтобы я делалне используйте модули, которые не созданы непосредственно сайтом (т. е. API приемлемы, но только официальный API Google).Только BeautifulSoup был санкционирован как плагин (не спрашивайте почему).
Ниже приведен пример кода, который я пробовал.Я знаю, что это простой, но по самому первому запросу я получил:
HTTPError: HTTP Error 429: unknown ": слишком много запросов.
В некоторых ответах на другие вопросы упоминается API Google Trends - это реально? Я не смог найти никакой документации по официальному API.
Вот еще один пост, в котором описывается решение, которое я пробовал, но оно не работаетя:
https://codereview.stackexchange.com/questions/208277/web-scraping-google-trends-in-python
url = 'https://trends.google.com/trends/explore?q=sports%20cars&geo=US'
html = urlopen(url).read()
soup = bs(html, 'html.parser')
divs = soup.find_all('div')
return divs