Как я могу создать скрипт python, который может выводить данные с веб-сайтов? - PullRequest
0 голосов
/ 17 июня 2020

Я хотел бы знать, как создать сценарий python, который может получать выходные данные с веб-сайтов. Точнее говоря, найдите как минимум синонимы слова, а затем, если возможно, сфотографируйте эти синонимы.

Я пробовал этот фрагмент кода:

import webbrowser

synonyms = []
word = input("what word?")
webbrowser.open('http://thesaurus.com')

Но я не знаю, как поместить word в строку поиска или взять оттуда вывод. Я также никогда не пробовал использовать изображения в python. Я даже не знаю, возможно ли это.

Спасибо за ваше время.

Ответы [ 2 ]

0 голосов
/ 17 июня 2020

Кажется, что веб-сайт тезауруса вызывает URL-адрес API при поиске синонимов, поэтому вы можете напрямую вызывать API своим словом и извлекать список синонимов, например:

import requests

word = input("what word?")
url = "https://tuna.thesaurus.com/pageData/" + word
r = requests.get(url)
dict_synonyms = r.json()['data']['definitionData']['definitions'][0]['synonyms']
synonyms = [r["term"] for r in synonyms]
print(synonyms)

API отвечает JSON со многими другими данными, поэтому я просто выбрал синонимы.

0 голосов
/ 17 июня 2020

Вы можете искать слово по ссылке https://www.thesaurus.com/browse/<your word>. Запрос этой ссылки с помощью метода GET вернет страницу с синонимами.

Вы можете сделать снимок экрана страницы, преобразовав html текст в png, например, с помощью imgkit. Но он может отличаться от исходной страницы из-за кода javascript на странице. В качестве альтернативы вы можете использовать селен-фреймворк. Он действует как браузер и может сохранять экраны страниц.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...