Это может не помочь вам с двоичным форматом .doc, но для более нового формата .docx я смог добраться до уравнения, которое встроено как документ OLE, используя следующий код:
InputStream in = new FileInputStream(f);
XWPFDocument doc = new XWPFDocument(in);
for (PackagePart p : doc.getAllEmbedds()) {
POIFSFileSystem poifs = new POIFSFileSystem(p.getInputStream());
byte[] oleData = IOUtils.toByteArray(
poifs.createDocumentInputStream("Equation Native"));
}
И затем вы можете извлечь данные MathType и передать их анализатору MTEF .
Если вам не нужны данные MathType, есть также изображение-заполнитель (в формате WMF), которое просто отображает уравнение.