Подстрока строки на 90% без разрыва HTML с помощью Java - PullRequest
0 голосов
/ 10 января 2012

Что было бы лучшим решением для создания метода, который бы брал строку, содержащую HTML, и откалывал бы последние, скажем, 10% строки, но без разрыва каких-либо тегов HTML.

Теги body и header не являются частью строки HTML.

Кроме того, округление должно происходить вверх, так что последние говорят, что если последние 10% сократятся до 5%, если HTML должен остаться внетронутые методы должны скорее сократить начало HTML и выполнить сокращение на 15%, что будет началом тега.

Я подумываю использовать для этого Jsoup .Проблема в том, что строка не может быть заключена в элементы HTML.Это может быть просто текст с парой ссылок.

1 Ответ

3 голосов
/ 10 января 2012

Я думаю, что Jsoup - правильный путь, удаляйте элементы из нижней части страницы и проверяйте длину строки на каждом шаге, пока не достигнете нужного числа.

Для удаления элементов по одному вы можете использовать метод remove , а затем сравнить исходную длину строки с текущей длиной строки документа HTML. Я не вижу там никаких проблем с эффективностью.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...