Каковы наилучшие варианты для выполнения Web Scraping не открытой в данный момент вкладки из расширения Google Chrome с JavaScript и другими доступными технологиями. Также принимаются другие JavaScript-библиотеки.
Важно скрыть скребок, чтобы он вел себя как обычный веб-запрос . Нет признаков AJAX или XMLHttpRequest, как X-Requested-With: XMLHttpRequest
или Origin
.
Зачищенный контент должен быть доступен из JavaScript для дальнейшей манипуляции и представления внутри расширения, скорее всего, в виде строки.
Есть ли какие-либо хуки в любом API, специфичном для WebKit / Chrome, которые можно использовать для создания обычного веб-запроса и получения результатов для манипуляций?
var pageContent = getPageContent(url); // TODO: Implement
var items = $(pageContent).find('.item');
// Display items with further selections
Бонусные баллы за выполнение этой работы из локального файла на диске , для начальной отладки. Но если это единственное, что останавливает решение, не обращайте внимания на бонусные очки.