Существует множество версий форматов MS. Так что, возможно, потребуется преобразовать их все в одинаковые форматы. Затем, имея zip с Content.xml, вы можете перевести его в свой собственный формат XHTML. И вы можете, по крайней мере, отображать контент в простом стиле.
MS docs -[converter]-> single format -[XSLT+java]-> prepared HTML -[web app]->