Одна важная вещь - проверить, что вы получаете в Doc при разборе HTML, потому что с ним может быть несколько проблем, таких как:
1. Сайт может использовать фреймы для отображения контента
2. Отображение контента с помощью Javascript
3. на нескольких сайтах есть скрипты, которые не разрешают парсинг jsoup, поэтому элемент doc будет содержать случайные данные