Глядя на ваше текущее регулярное выражение:
String patternString = "(latest-all\\.ttl\\.gz<\\/a>)(.*)";
Это соответствует строке вида latest-all.ttl.gz<\/a>
, за которой следует что-то, что я не верю, что вы хотите.
СначалаВ исходном HTML-коде, которым вы поделились, не встречается ни слова «latest-all.ttl.gz» (я полагаю, вы хотели вместо этого искать «latest-all.json.bz2»). И, во-вторых, косые черты не нужно экранировать в регулярном выражении.
Итак, имея это в виду, регулярное выражение, которое должно сделать трюк:
String patternString = "(latest-all\\.json\\.bz2</a>)[\\n]*(.*)";
(я добавил [\\n]*
часть, чтобы исключить любые новые строки между тегом <a>
и вашей датой).