Я хотел бы создать скребок для изображений, который очищает изображения от Bing, Google или любой другой поисковой системы. Есть много ответов и информации по этому вопросу, но похоже, что они больше не работают, так как эти компании пытаются заставить людей использовать их специфические c поисковые API. Теперь мой вопрос, если это все еще возможно очистить, например, Bing для изображений. Я начал играть с отправкой XMLHttpRequests на https://www.bing.com/images/search?q=banana
. Я сделал это с библиотекой NodeJs и с эквивалентом браузера. Результаты сравнимы со следующим запросом
curl -A "Chrome/80.0.3987.149" "https://www.bing.com/images/search?q=banana"
Конечно, есть некоторые .jpg
, но они кажутся как-то случайными и иногда даже не связаны с термином banana
. Основной целью было бы получить оригинальный URL, где Бинг нашел изображения. Или получить то же представление, что и при просмотре элементов в инструментах разработчика.
Кто-нибудь знает о современном проекте с открытым исходным кодом или как мне начать этот путь?