Мне любопытно, есть ли в Java какие-либо библиотеки (или, возможно, веб-сервисы, которые я могу вызвать), которые просматривают ссылки, как это делается в Facebook.
Сейчас я занимаюсь чтением URL-адреса с использованием new URL([url here]
) и анализом html, чтобы получить содержимое, которое я хочу напечатать. Это означает удаление ненужных тегов и всего.
Но это на самом деле слишком грубо, поскольку оно зависит от конкретного сайта.
Как и в WordPress, мне нужно прочитать все содержимое в сегменте <div class="post"></div>
. В блоггере все может быть по-другому, а какие другие сайты по всему миру обслуживают только статический текст?
Есть ли лучшее решение?