Я хочу очистить текст с динамически загруженного веб-сайта, для которого мне нужен динамический анализ.Из-за динамической загрузки такие параметры, как $ lynx --dump google.com
, похоже, не работают.Для этого я использовал Headless Chrome, так что
$ Chrome --headless --disable-gpu --no-sandbox --run-all-compositor-stages-before-draw --virtual-time-budget=1000 --window-size=1200,3000 --screenshot http://mtv.com
, но я не могу найти вариант, чтобы выскоблить текст с сайта.Я доступен для всех вариантов динамической очистки, чтобы получить текст определенного div, например, с некоторым классом.
Как я могу вырезать текст с динамически загружаемого веб-сайта?
Пример результата при динамической загрузке с использованием хрома без головки ![enter image description here](https://i.stack.imgur.com/4sTLw.png)