Если у вас есть MS Office и вы сохраняете PPT в RTF (Rich Text Format), он содержит только текст из презентации. Затем вы можете открыть файл в любом редакторе, который понимает файлы RTF, и сохранить его как текстовый (TXT) файл.
Я ожидаю, что это будет работать и в Open Office.
Поскольку вы говорите об API, возможно, это не тот путь, который вам нужен, но, возможно, он даст вам новые идеи, как туда добраться. Скажем, вы используете несколько макросов для поэтапного преобразования ...
Редактировать: мне стало любопытно и я сделал короткий поиск в Google
Это то, что я нашел на на одной из страниц www.openoffice.org
Как указали люди в этой теме, извлечение текста из ОО
документ не сложный, так как это просто архивированный XML, который можно проанализировать с помощью
скрипт на Perl Проблема заключается в получении документов Microsoft Powerpoint в
в первую очередь в формате zip XML.
Я обнаружил, что File -> Wizards -> Document Convertor делает именно это.
Просто скажите, что вы хотите конвертировать документы Powerpoint, а не шаблоны,
укажите его в исходный каталог и где вы хотите выплюнуть
результат, и вы в отъезде.
Затем я нашел unzip -p $ file.sxi content.xml | perl -p -e
"s / <[^>] > / \ n / g; s / + //; s / \ n \ n / \ n / g;" -w
довольно хорошо работает для извлечения текста.
Извините, у меня нет Open Office, чтобы попробовать что-то подобное.