У меня есть кусок кода, который я использую для чтения документов MS Office Word.
static void ReadMSOfficeWordFile(string file) {
try {
Microsoft.Office.Interop.Word.Application msWordApp = new Microsoft.Office.Interop.Word.Application();
object nullobj = System.Reflection.Missing.Value;
object ofalse = false;
object ofile = file;
Microsoft.Office.Interop.Word.Document doc = msWordApp.Documents.Open(
ref ofile, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj, ref nullobj, ref nullobj,
ref nullobj);
string result = doc.Content.Text.Trim();
doc.Close(ref ofalse, ref nullobj, ref nullobj);
msWordApp.Quit();
CheckLineMatch(file, result);
}
catch {
RaiseError("Unable to parse file because of MS Office error.", file);
}
}
У меня есть три проблемы с этим.
Во-первых, он зависит от установки MS Office в каждой системе, на которой он может работать. Некоторые люди предпочитают Libre Office, но это все равно необходимо для работы с документами MS Office Word.
Во-вторых, я не знаю, будет ли это работать даже для документов MS Office 2003 и MS Office 2007 ...
Третий - МЕДЛЕННО. Это мучительно медленно.
SO! Я предполагаю, что ДОЛЖЕН быть лучший способ запустить его, чем этот. Я предполагаю, что кто-то должен знать о лучшем способе, чем новичок. Я только пытаюсь прочитать текст в документе, ничего больше.