Если вы знаете, что текст, который вы хотите, приходит до любых вложенных элементов, вы можете просто захватить его первый дочерний элемент, который будет содержать ваш текст и некоторые пробелы:
HtmlTableHeaderCell th = ...
System.err.println( th.getFirstChild().toString().trim() ) ;
более общим решением было бы перебрать дочерние элементы th
для поиска текстовых узлов и игнорирования подэлементов.