Ваше регулярное выражение смотрит на ВСЕ <a href...
теги.«handle» всегда используется как «/ dspace / handle» и т. д., так что вы можете использовать что-то вроде этого, чтобы очистить URL, которые вы ищете:
Pattern pattern = Pattern.compile("<a.+href=\"(/dspace/handle/.+?)\"");