Мне нужно выяснить, что происходит внутри .ppt
файлов клиента.Какой хороший способ начать работу?
Моя надежда - преобразовать его в HTML.Но если я просто экспортирую .ppt
в HTML, я получу много изображений (в отличие от текста), что нехорошо.
EDIT: программа, которая автоматически конвертирует .ppt
в HTML, будетбыть потрясающим, при условии, что он сохраняет как можно больше информации в текстовом формате.Если этого не существует, то лучше всего понять внутренности .ppt
и написать свой собственный код для частичного преобразования.
РЕДАКТИРОВАТЬ: я использовал OfficeConvert в соответствии с рекомендациями Michiel Leenaars.С ним все в порядке.Мой 50-страничный тестовый файл объемом 8 МБ превратился в 40 МБ текста.Тот факт, что я получил текст это хорошо.Тот факт, что сумма пошла вверх, движется в неправильном направлении.И там очень много повторений.Слово «стиль» появилось 410815 раз;Слово «рисовать» появилось 351229 раз.