Я работаю над простым клиент-серверным проектом.Клиент написан на Java, он отправляет ключевые слова на сервер C ++, написанный под Linux, и получает список URL с лучшими рангами (в зависимости от количества вхождений ключевых слов).Работа сервера заключается в том, чтобы просматривать некоторые URL-адреса в поисках ключевых слов и возвращать наиболее подходящие URL-адреса.И теперь проблема в том, что мне нужно анализировать HTML-сайты, чтобы найти вхождения ключевых слов, плюс мне нужно извлечь ссылки с посещенной страницы , чтобы также искать по ним.И мой вопрос: какую библиотеку я могу использовать для этого?Помните, только библиотеки C ++ linux подходят для меня.Было несколько похожих тем, поэтому я попытался просмотреть большинство из них, но некоторые библиотеки разбирают только html-файлы, и я не хочу загружать каждый посещаемый сайт, а разбираю его на лету и просто сохраняю его рейтинг и URL,Некоторые из них выглядят немного сложными для меня - например, сначала парсинг HTML в XML или что-то еще, а затем, наконец, работа с результатами на C ++.Есть ли что-то простое и достаточное, чтобы сделать то, что мне нужно?Любой совет будет оценен.