Проблема действительно такая конкретная.
Мне нужна библиотека на Java, которая может принимать HTML-контент и генерировать текст в том же формате, что и программа Linux lynx.
Мне нужно предоставить данные, предоставленные сторонними серверами, конечным пользователям на Android. Формат данных древний, в плохо отформатированном HTML, настолько, что я пытался читать его, используя java, и иногда он терпел неудачу (неприемлемо). Он также растет с каждым месяцем (исключая предварительную установку), и я не могу убедить их перейти на «современные» вещи (жизнь в XML и т. Д. Была бы великолепна).
Кратчайший маршрут: я написал класс для использования службы W3 html2txt онлайн (поиск в Google). Он работал нормально в приложении, пока я не получил жалоб и не заметил, что служба W3 иногда дает сбой. Это не такая уж большая проблема, но логика черного ящика предполагает, что вывод будет в этом «похожем на рысь» текстовом формате.
Поэтому я бы хотел, чтобы библиотека выполняла преобразование (HTML-> TXT) в «стиле рыси» внутри приложения и избегала сбоев в работе сервиса W3. И кроме того, рысь выводит, пожалуй, лучшее, что я видел, самое организованное и аккуратное.
Ребята, вы что-нибудь знаете?