Как скопировать необработанный текст с сайта без использования буфера обмена - PullRequest
2 голосов
/ 26 июня 2019

Я сделал скребок с кукловодом, который идет на прессы сайта Ctrl + A и Ctrl + C и копирование текста в файл.

Это очень простой скрипт, но очень раздражает, что он использует буфер обмена Windows, потому что, если я позволю скрипту работать в фоновом режиме, я не смогу ничего скопировать и вставить.

Есть ли другой способ скопировать необработанный текст с веб-сайтов без использования буфера обмена Windows? Под raw text я подразумеваю весь текст, который вы видите при посещении веб-сайта и нажимаете Ctrl + A .

1 Ответ

1 голос
/ 26 июня 2019

Вы можете получить значение innerText из document.body, которое должно содержать такой же (или, по крайней мере, очень похожий текст), что и Ctrl + A , Ctrl + C даст вам.

Пример кода

const text = await page.evaluate(() => document.body.innerText);
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...