Это во многом зависит от характера HTML-документа, который вы пытаетесь преобразовать. Один простой способ - использовать автоматизацию Word, чтобы открыть документ .html, а затем сохранить его как документ .doc.
object readOnly = false;
object isVisible = true;
object missing = System.Reflection.Missing.Value; // Values we don't care about
object fileName = "C:/webpage.htm";
object newFileName = "C:/webpage.doc";
Microsoft.Office.Interop.Word.Application word = new Microsoft.Office.Interop.Word.Application();
// word.Visible = true; // To see what's happening
Microsoft.Office.Interop.Word.Document document = word.Documents.Open(ref fileName, ref missing, ref readOnly, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing);
document.Activate();
object saveFormat = Microsoft.Office.Interop.Word.WdSaveFormat.wdFormatDocument;
document.SaveAs(ref newFileName, ref saveFormat, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing);
document.Close(ref missing, ref missing, ref missing);
Примечание
- Вы должны добавить ссылку на Microsoft.Office.Interop.Word или что-то подобное
- Количество ref отсутствует аргументов зависит от того, какую версию Word вы используете
- Вы должны использовать полные пути в имени файла, так как экземпляр Word запускается из системной папки.