Это непросто, по крайней мере, не понять всего этого.
Вы можете взглянуть на пакет удаления метаданных под названием Metadact от Litera (ранее Softwise).
На рынке тоже есть несколько других.
Если вы хотите сделать это самостоятельно, сначала вам нужно решить, что вы считаете «метаданными».
Некоторым довольно легко добраться до использования объектной модели Word (взаимодействие с C # или VB).
К некоторым нельзя получить доступ через Word, поэтому для этого вам нужно использовать API структурированного хранилища (как и 10 последних авторов).
Если вы говорите о файлах DOCX, вы можете использовать OpenXML SDK, чтобы получить доступ ко всем пакетам внутри файла. затем используйте XML для навигации и редактирования ненужных битов.
Однако в таком случае гораздо труднее удалить «метаданные» из содержимого документа, поскольку вам придется иметь дело с внутренними структурами Word, такими как RUN, и изменять отслеживание.