OpenOffice имеет читатель RTF. Вы можете использовать python для сценария OpenOffice, см. Здесь для получения дополнительной информации .
Возможно, вы могли бы попытаться использовать магический com-объект в Windows, чтобы прочитать все, что пахнет ms-бинарным. Я не рекомендовал бы это все же.
На самом деле синтаксический анализ необработанных данных, вероятно, не будет очень сложным, посмотрите этот пример , написанный на .bat / QBasic.
DocFrac - бесплатный конвертер с открытым исходным кодом между RTF, HTML и текстом. Доступны платформы Windows, Linux, ActiveX и DLL. Скорее всего, это будет легко обернуть в python.
RTF :: TEXT :: Converter - Расширение Perl для преобразования RTF в текст . (если у вас проблемы с DocFrac).
Официальный Rich Text Format (RTF) Технические характеристики , версия 1.7, от Microsoft.
Удачи (с ограниченными привилегиями в Вашей рабочей среде).