Как читать HTML, используя библиотеки C ++ в Linux? - PullRequest
1 голос
/ 26 октября 2010

Существуют ли какие-либо библиотеки C ++ для чтения HTML в Linux?

Ответы [ 3 ]

2 голосов
/ 26 октября 2010

libcurl - ваш друг + приборка (HTML приборка), если вы исправили неисправный HTML.

Редактировать: Вот полная последовательность

HTML (в файле) -> приборка(который очистит искаженный HTML) -> XSLT-преобразование (вам понадобится XSL-файл для перевода HTML-кода в латекс) и используйте libxml / libxsl (http://xmlsoft.org/) -> latex-документ затем обрабатывается с использованием latexответив на команду latex) или, если хотите, вы можете скачать исходный код для lyx и посмотреть, как они это делают (http://www.lyx.org/). К сожалению, последовательность слишком сложна, чтобы написать ее в одном примере, все, что я могу вам дать, этопоследовательность ...

0 голосов
/ 28 декабря 2010

Попробуйте http://xmlsoft.org/

libxml2 может анализировать HTML, это ANSI C и с ним связано много привязок.

0 голосов
/ 26 октября 2010

Посмотрите на следующее:

Также был подобный вопрос , уже заданный.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...