По сути, ответ «Нет, вы не можете сделать это так, как вы предлагаете».
Да, Word действительно добавляет «скрытые символы» в поток текста, который не может быть выбран с помощью объектамодель.Попытка работать со значениями индекса символа не будет работать надежно.Надежный метод - встроенный в Word поиск / замена с подстановочными знаками.Если RegEx абсолютно необходим, то какой-то вид Find / Replace в диапазоне символьных индексов (скажем, начиная с 5 символов до и заканчивая 5 символами после индексов, вычисленных с использованием RegEx) может быть способом двойной проверки результата и полученияправильный диапазон.
Возможно, в зависимости от того, что это за анализ, может быть лучше работать с закрытым файлом, используя Office Open XML.В этом не будет проблемы «скрытых символов», которые Word использует для структурной информации.С другой стороны, есть много информации о форматировании, которая разбивает текстовые прогоны, которые необходимо согласовать с ...