Очистка содержимого * .aspx с использованием Python - PullRequest
2 голосов
/ 30 апреля 2010

У меня проблемы с очисткой динамически сгенерированной таблицы в ASPX. Попытка вычистить цены на газ с сайта, подобного этому GasPrices . Я могу извлечь всю информацию из таблицы цен на газ (адрес, время подачи и т. Д.), За исключением фактической цены на газ.

Есть ли способ, которым я мог бы пересмотреть цены на газ? то есть как-то получить текстовое представление об этом. Я не очень знаком с ASP / ASPX - но то, что генерируется сейчас, не отображается в окончательном HTML. Я использую Python для очистки, но это не имеет значения, если нет конкретной библиотеки ...

Заранее спасибо.

1 Ответ

4 голосов
/ 30 апреля 2010

Происхождение страницы (aspx) здесь не проблема.

Похоже, они активно пытаются помешать попыткам очистки.Числа не являются шрифтами, они представляют собой несколько элементов div рядом друг с другом с фоновыми изображениями , которые являются числами. Они действительно не хотят, чтобы их убирали.

(конечно, если бы вы действительно были уверены, вы могли бы сопоставить имя класса div с ... Они не оченьхорошо «зашифровано»)

Обратите внимание на уведомление об авторских правах внизу связанной страницы

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...