рекурсивно найти строку с подстановочным знаком в файлах Word Doc, вывести в текстовый файл, как избавиться от мусора Word? - PullRequest
3 голосов
/ 14 января 2012

Вот что я пытаюсь сделать:

  1. с помощью cmd.exe, перейдите на подключенный сетевой диск Windows
  2. есть иерархия папок в начальном каталоге с файлами .doc в них, в которых я хочу найти строку, которая начинается с "CCMPD", а затем имеет уникальные номера (номера дефектов).
  3. Иерархия не согласована, то есть некоторые папки имеют .doc на первом уровне, в других есть еще несколько папок, в которых находится документ.
  4. Вывести каждую соответствующую строку в файл.

Я придумал команду командной строки:

findstr / S "CCMPD" * .doc> D: \ Data \ FIND.txt

Это действительно работает (я очень горжусь этим), но файл заполнен мусором, который содержится в документе Word, и я не могу понять, как его отфильтровать. Я даже не могу вставить сюда вывод, потому что это не печатные символы, но вы, наверное, все видели их раньше.

Как создать команду поиска, которая может отфильтровывать мусор Word и выводить его в легко читаемый файл?

1 Ответ

2 голосов
/ 14 января 2012

попробуйте использовать инструмент Strings .Это позволит извлечь строки и избавиться от мусора.

...