Короткий ответ - нет, но длинный ответ - это сорт.
MS Word сам сохранит файл в формате html - но это полный бред. В некоторой степени это просто потому, что клиентская база, которая конвертирует текстовые файлы в html напрямую, не обеспокоена тем, что она небрежная, поэтому Word не усердно работал над созданием чистого вывода. С другой стороны, это по сути сложно, потому что слово ориентировано на создание нединамических документов фиксированного размера, таких как книга на бумажной основе. Так что легко конвертировать в другие статические форматы (скажем, в PDF), но как конвертировать в HTML? Вы просто делаете поток текста через? Вы устанавливаете ширину, которая, как мы надеемся, сделает макет таким же? Что если в слове doc есть шрифты или элементы макета, которые недоступны в HTML-рендерере?
Самое простое, что нужно сделать, это выполнить проект за проектом - например, вы можете создать DTD для преобразования RTF-файла - но это включает в себя принятие решения на уровне программиста о том, как они будут преобразованы.