Мне нужно проанализировать (на стороне сервера) большое количество HTML-страниц.
Мы все согласны с тем, что regexp - это не тот путь, по которому мы сюда идем.
Мне кажется, что javascript является родным способом парсинга HTML-страницы, но это предположение основано на коде серверной части, имеющем все возможности DOM, которые есть у javascript внутри браузера.
Имеет ли Node.js встроенную способность?
Есть ли лучший подход к этой проблеме, анализируя HTML на стороне сервера?