Попробуйте выполнить следующие действия: http://zanedp.livejournal.com/201222.html
Вот последовательность, которая преобразует мой файл LaTeX в простой текст:
$ latex file.tex
$ catdvi -e 1 -U file.dvi | sed -re "s/\[U\+2022\]/*/g" | sed -re "s/([^^[:space:]])\s+/\1 /g" > file.txt
Опция -e 1 для catdvi говорит ему выводить ASCII. Если вы используете 0 вместо 1, он выведет Unicode. Юникод будет включать все специальные символы, такие как маркеры, символы и греческие буквы. Он также включает лигатуры для некоторых буквенных комбинаций, таких как «fi» и «fl». Вам может не нравиться это. Итак, используйте -e 1 вместо. Используйте параметр -U, чтобы распечатать значение Юникода для неизвестных символов, чтобы вы могли легко найти и заменить их.
Вторая часть команды находит строку [U + 2022], которая используется для обозначения символов маркера (•), и заменяет их звездочкой (*).
Третья часть съедает все лишние пробелы, добавленные catdvi, чтобы сделать текст полностью выровненным, сохраняя пробелы в начале строк (отступ).
После выполнения этих команд вам будет целесообразно найти в текстовом файле строку [U +, чтобы убедиться, что не осталось символов Unicode, которые нельзя сопоставить с ASCII, и исправить их.