Я пытаюсь разработать простой веб-скребок.Я хочу извлечь текст без кода HTML.Фактически, я достигаю этой цели, но я видел, что на некоторых страницах, где загружен JavaScript, я не получил хороших результатов.
Например, если какой-то код JavaScript добавляет какой-то текст, я не вижупотому что, когда я звоню
response = urllib2.urlopen(request)
, я получаю исходный текст без добавленного (потому что JavaScript выполняется в клиенте).
Итак, я ищу некоторые идеи длярешить эту проблему.