Размещение нескольких сотен страниц .doc на веб-странице - PullRequest
1 голос
/ 14 июля 2010

У меня есть сотни файлов .doc с текстом, который мне нужно поместить на веб-страницы.

Я понимаю, что могу преобразовать каждый файл .doc в .txt, а затем использовать включение на стороне сервера для встраивания содержимогокаждая страница в веб-страницу.Это сэкономило бы много времени, потому что у меня могла бы быть просто одна страница .php? Txt = ..., которая будет отображать другое включение .txt в зависимости от ссылки, которую пользователь нажал, чтобы попасть туда.Это прекрасно работает с контентом.

Однако все форматирование теряется при конвертации в .txt (заголовки должны быть выделены жирным шрифтом)

Когда я конвертирую эти файлы .doc в .html, используяMicrosoft Word, ~ 20 строковых документов становятся раздутыми> 300-строчными .htm файлами (вероятно, потому что каждый абзац помещается в текстовые поля)

«Очистка Word HTML» Dreamweaver немного помогла, но код все еще был чрезвычайно раздутым

Как бы вы предложили это сделать?

edit: Возможно, я решил собственный вопрос, пытаясь встроить документы Google на свою страницу.

Ответы [ 5 ]

0 голосов
/ 15 июля 2010

Существует набор программ, который называется wv (прежний mswordview).У него есть программа wvWare.Это программное обеспечение может преобразовывать документы Word в HTML.

Кроме того, вы можете использовать вывод из Word и отправить его через приборку.Это исправляет разметку и обычно может обрабатывать ошибки, допущенные Word.

0 голосов
/ 14 июля 2010

Хорошо, спасибо всем за ваши предложения, но я хотел, чтобы эта страница была доступна всем без просмотра PDF.

Документы Google позволяют массово загружать текстовые файлы (и конвертируют их для вас тоже)

Затем вы можете экспортировать их в iframe для встраивания в любой HTML-документ.

0 голосов
/ 14 июля 2010

MS Word является вирусом. Его собственная разметка раздута, и поэтому любая попытка автоматически преобразовать ее в HTML унаследует эти проблемы. Вы в конечном итоге с мусором, как: <strong><strong></strong></strong> без уважительной причины.

Dreamweaver может многое почистить, но ничто, кроме полоски / комментария, не даст вам чистых результатов.

Именно поэтому большинство людей используют PDF-файлы для этого типа проблемы.

0 голосов
/ 14 июля 2010

Моя немедленная реакция - конвертировать документы в PDF. Это обычно хорошо сохраняет форматирование, и пользователи обычно настраивают свои браузеры на просмотр PDF-файлов тем или иным образом (и те немногие, кто этого не делает, несомненно, привыкли к невозможности просмотра большого количества документов на многих сайтах).

0 голосов
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...