Какой надежный способ автоматического подсчета символов и / или слов в файле .doc или .docx?
Единственное реальное требование - это достаточно точный и достаточно надежный счет.
Требуется:работать с документами, содержащими что-то отличное от латинского алфавита, поэтому для большинства случаев достаточно подсчета символов.
Число необязательно должно совпадать с Word, но чем ближе, тем лучше.
Поскольку существует множество различных приложений,может генерировать файлы .doc, нормально ничего не подсчитывать, но этот случай должен быть отслеживаемым, поэтому мы знаем, что подсчет может быть неточным.Во всех остальных случаях, скажем, счет должен быть, по крайней мере, на 99% точным, по крайней мере, на 99% времени.
Я открыт в отношении задействованных технологий, но что-то, что может выполняться по команде * NIXлиния будет очень предпочтительным.
Есть ли разумное решение для этого?