Вы можете попробовать Toxy, инфраструктуру извлечения текста / данных с открытым исходным кодом для .NET. На данный момент он поддерживает xls, xlsx, doc, docx. Он будет поддерживать pptx в версии 1.5 очень скоро.
Для получения подробной информации, вы можете проверить здесь