У меня есть несколько документов Word, из которых я хотел бы удалить некоторые элементы. Я хотел бы сделать следующее:
- Скопируйте и вставьте все содержимое файла слова (может не понадобиться) и переместите его в текстовый файл ИЛИ конвертируйте .doc в .txt
- Использование регулярного выражения: заменить
\[.*\]
на "" И заменить \(.*\)
на ""
- Сохранить результат в текстовом файле с тем же именем, что и исходный текст документа.
Мысли и направление приветствуются. В настоящее время, я не знаю, как сделать что-то из этого программно. Я делаю это вручную, как есть.
Если это имеет значение, я использую Ubuntu 11.04