невозможно прочитать преобразованный файл HTML из Word в C # - PullRequest
0 голосов
/ 04 сентября 2010

Проблема, которую я пытаюсь решить:

Я хочу преобразовать текстовый документ в HTML, а также я хочу преобразовать определенный текст в гиперссылки.Я не могу найти способ в C # добавить гиперссылки перед сохранением документа Word как HTML.Итак, я делаю трюк, я сохраняю документ как HTML, а затем читаю документ HTML и заменяю определенный текст гиперссылкой.

Я не знаю, является ли это лучшим способом сделать это, но пока я не нашел другого варианта.

Теперь проблема в том, что когда я читаю файл HTML,Я получил мусорные символы для некоторых специальных символов.В моем текстовом документе у меня есть «...» три точки, которые я считаю специальным символом в слове, поэтому, когда я читаю это в HTML, я получаю мусорные буквы ... Странно то, что когда я открываю этот HTML-файл в блокнотеон показывает меня правильно.

Однако, благодаря кодированию я не могу читать такие символы.

Пожалуйста, помогите мне.

Ответы [ 2 ]

0 голосов
/ 05 сентября 2010

Моя настоящая проблема заключалась в том, что я хотел преобразовать определенный текст в текстовом документе в гиперссылки, и я не мог найти способ сделать это. Помощь MSDN действительно жалкая и с ошибками, которые потратили много времени. Я новичок в автоматизации текстовых документов.

Вот почему мне было легко добавлять гиперссылки после преобразования файла в HTML, но у этого есть свои проблемы. Вот как я это делаю сейчас

Библиотека Word предоставляет вам функцию поиска, но она не сообщает вам позицию, в которой был найден текст.

Найдите текст и начальную позицию, а затем

Address = doc.Range (начало, конец) .Text + ".pdf"

doc.Hyperlinks.Add (doc.Range (начало, конец), адрес, _

                                SubAddress, ScreenTip, TextToDisplay, Target)
0 голосов
/ 04 сентября 2010

Звучит так, как будто вам может понадобиться заглянуть в кодировку , используемую словом ms doc.MS Word может использовать ASCIIEncoding.

Также обратите внимание на существующие библиотеки c #, которые делают это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...