Я хочу, чтобы мой сценарий извлекал данные html с сайта, но он возвращает страницу, которая говорит, что он знает, что мой сценарий является ботом, и дает ему пройти тест «Я не робот».
Вместо того, чтобы возвращать содержимое сайта, он возвращает страницу, которая частично читается ... "
Когда вы просматривали, что-то в вашем браузере \ n заставило нас думать, что вы бот."
Мой код ...
const axios = require('axios');
const url = "https://www.bhgre.com/Better-Homes-and-Gardens-Real-Estate-Blu-Realty-49231c/Brady-Johnson-7469865a";
axios(url, {headers: {
'Mozilla': 'Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:47.0) Gecko/20100101 Firefox/47.3 Mozilla/5.0 (Macintosh; Intel Mac OS X x.y; rv:42.0) Gecko/20100101 Firefox/43.4.0',
}})
.then(response => {
const html = response.data;
console.log(html)
})
.catch(console.error);
Я пробовал несколько разных заголовков, но сайт не обманывает, что мой сценарий - человек. Это в NodeJS.
Возможно, это имеет или не имеет отношения к моей проблеме, но, надеюсь, этот код будет существовать на сервере моего сайта в React, который я создаю. Я не пытаюсь почистить сайт как единое целое. Я хотел бы, чтобы мой сайт читал с этого сайта немного контента вместо того, чтобы вручную обновлять мой сайт битами контента на этом сайте при каждом его изменении.