Есть ли способ получить содержимое буфера обмена WordprocessingML в Java? - PullRequest
1 голос
/ 21 апреля 2009

У меня есть клиент, которому удалось вставить текст WordprocessingML в наше приложение. Насколько я знаю, это было прямое копирование и вставка из Word 2000 в наше приложение Java. Я перепробовал каждую комбинацию версий Word и Java, но не могу воспроизвести это поведение, особенно потому, что наше приложение фильтрует HTML и текст / обычный текст.

Я почти уверен, что в более старой версии Office были собственные буферы обмена и экспортировались только форматы, которые должны быть доступны другим программам. Каждая известная мне офисная версия (кроме, может быть, 2007) экспортирует HTML, RTF и Plain.

Есть ли способ поместить контент WordprocesingML в буфер обмена и, возможно, заставить Java смешивать данные вкусы

1 Ответ

1 голос
/ 21 апреля 2009

Apache POI - это API-интерфейс Java для доступа к файлам формата Microsoft. HWPF является его частью для чтения и записи файлов MS Word. Apache TIKA - это инструментарий для обнаружения и извлечения метаданных и структурированного текстового содержимого из различных документов с использованием существующих библиотек синтаксического анализатора. Это также дает некоторую поддержку для документов MS Word. Я предлагаю вам посмотреть, соответствуют ли они вашему варианту использования.

...