Скрипт для разбора документа winword doc - PullRequest
0 голосов
/ 14 марта 2011

Документ MS Office Word имеет следующую структуру:

Title(line, font size 14)
Description(paragraph, font size 12)
Some other paragraphs of text(font size 12)

Мне нужен скрипт для извлечения заголовков и описаний из этого документа (и, например, для помещения их в таблицу Excel). Есть идеи по поводу такого скрипта?

1 Ответ

0 голосов
/ 17 марта 2011

Что ж, вам, возможно, понадобится прояснить вопрос немного подробнее.Но что касается сценария,

1) Использование VBA (это часть Word), вы можете легко написать небольшой макрос VBA, который загрузит документ, проанализировать эту информацию, записать ее в файл CSV изакройте документ, затем повторите для следующего документа.2) VBScript (в основном то же, что и выше, но в качестве языка используется VBScript, похожий, но не совсем такой, как VBA).3) JavaScript (та же идея, что и в VBScript выше).4) Powershell (.net способ сделать то же самое).

Лично, если это будет одноразовая сделка, я пойду с VBA и покончу с этим.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...