Я хотел бы прочитать и разобрать размеченный текст (возможно, микроформат, микроданные, rdf или аналогичные).Я должен создать свой собственный анализатор или есть какая-либо библиотека Java, которая может помочь с этим?
Ты уже гуглил от этого ?!:-) "микроформат + анализатор java" в Google даст вам ссылку на http://microformats.org/wiki/parsers
Микроформаты - это микроданные, хотя с общей целью разные технологии.
Я бы порекомендовал вам взглянуть на Apache Any23