Вам просто нужно проанализировать HTML-код, который вы хотите записать в JSOUP, а затем выбрать атрибуты HTML-тегов, которые вы хотите, используя селектор attr из элементов JSOUP, и это даст вам значениеэтот атрибут для каждого тега в HTML.Чтобы получить также текст, содержащийся между тегами span, вам нужно выбрать вложенный интервал в th и получить .text () .
Document document = Jsoup.parse(YOUT HTML GOES HERE);
System.out.println(document);
Elements elements = document.select("tr > th");
for (Element element : elements) {
String align = element.attr("align");
String color = element.attr("bgcolor");
String spanText = element.select("span").text();
System.out.println("Align is " + align +
"\nBackground Color is " + color +
"\nSpan Text is " + spanText);
}
. Для получения дополнительной информации не стесняйтесьспросите меня!Надеюсь, что это вам помогло!
Обновлено Ответ на комментарий:
Чтобы сделать это, вам нужно использовать эту строку внутри для каждого цикла:
String fullText = element.text();
Таким образом, вы можете получить весь текст, содержащийся между выбранными тегами Element, но вам нужно поискать в этом блоге и соответствовать желаемому запросу.Я предполагаю, что вам также нужно проверить, является ли строка пустой или нет, и выполнить отдельные запросы для каждого возможного случая, используя условные выражения IF.
Это подразумевает наличие одного для этой структуры: tr> th>span , другой для этого: tr> th> em , а другой для: tr> th .