Если вы хотите использовать COM-интерфейс в C, вы можете использовать интерфейс IFilter , встроенный в каждую версию Windows начиная с Windows 2000. Вы можете использовать его для извлечения текста из любого офисного документа (Word, Excel и т. д.), файла PDF или любого типа, для которого установлена поддержка IFilter.
Я написал в блоге об этом несколько лет назад. Это все C ++, но вы можете использовать COM-объекты из C.