Чтение файлов Microsoft Works и / или One Note из Java - PullRequest
6 голосов
/ 31 декабря 2010

Я ищу способ чтения файлов Microsoft Works (.wps) и One Note (.one) в приложении Java.На самом деле все, что меня волнует, - это извлечение читаемого текста из этих файлов, чтобы я мог их проиндексировать.

Я успешно использовал библиотеки Apache POI и Tika для извлечения текста из большинства других форматов Micrososft, но эти двавсе еще неуловим.

Спасибо, Фрэнк

1 Ответ

3 голосов
/ 31 декабря 2010

Насколько я могу судить, формат файла .one (One Note) проприетарный, но есть COM API: http://msdn.microsoft.com/en-us/library/ms788684(office.12).aspx#Office2007OneNoteWhatsNew_OneNote2007COMAPI, который вы могли бы написать что-то для преобразования данных на другом языке и вызова его?

Несколько программ поиска в Google показывают программы, которые могут конвертировать файлы wps, но я не вижу ни Java-API, ни какой-либо документации.Это может быть выполнимо.Не знаете, сколько файлов вы имеете дело, но вам может понадобиться использовать другое приложение для преобразования файла или пользователи запускают другое приложение, чтобы сначала преобразовать его?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...