инструмент для конвертации веб-сайта HTML - PullRequest
0 голосов
/ 29 марта 2011

Мой клиент хочет изменить внешний вид своего сайта.Содержание и расположение страниц останутся прежними, даже в зависимости от изображений в статьях.Только дизайн изменится.Был выбран дизайн, а также была создана статическая HTML-страница.

Я хочу, чтобы инструмент выполнял следующие действия:

  1. Загрузка всех страниц на веб-сайте (все страницы являются HTML-страницами)
  2. возьмите HTML-часть статьи внутри страниц и поместите их в предоставленный мной шаблон.
  3. Запишите их в выходной каталог на моем компьютере.

Я просто хочу html-страницы, нет необходимости загружать изображения, CSS или Javascript.

Есть идеи?

Ответы [ 2 ]

1 голос
/ 29 марта 2011

Да, инструмент для этой клещи будет трудно найти Но если все страницы имеют одинаковый формат, вы можете использовать strip_tags и найти и заменить, чтобы удалить HTML и все, что вам не нужно. это даст вам только строку статьи, чтобы переписать вам новый шаблон.

1 голос
/ 29 марта 2011

Не думаю, что вы найдете инструмент, который сможет это сделать.Может быть, Perl (или аналогичный) скрипт, который загружает все страницы (wget), а затем анализирует в поисках определенного регулярного выражения table / css-class, чтобы определить, где находится содержимое статьи.Если все файлы имеют одинаковый и хорошо структурированный формат, это не должно быть проблемой.Затем ваш сценарий записывает этот контент в другой хорошо отформатированный файл (ваш шаблон) в определенную позицию, обозначенную каким-то 'div class = "article"'.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...