Очистка экрана с помощью Ruby on Rails - PullRequest
0 голосов
/ 01 ноября 2009

Я новичок в RoR. Я хочу разработать приложение rails, которое могло бы искать информацию о рейсах из моего приложения rails, получать информацию о рейсах с различных сайтов авиакомпаний (например, авиакомпаний airasia и malaysia). отобразить эти результаты в моем приложении rails.
Мой поисковый модуль должен включать следующие текстовые поля:

From: Kuala Lumpur
To: Dubai
Departure Date:2/11/2009
Return date: 19/11/2009
Departure Time: 12:00
Number of tickets: 2

пользователь получает возможность ввести информацию выше на моем сайте и
скрипт должен искать рейсы по этой информации на сайтах разных авиакомпаний и
отображать результаты с тегом того, какие авиакомпании предоставляют этот рейс.

Можно использовать "Scrapi" или "Scrubyt"

Ответы [ 3 ]

5 голосов
/ 01 ноября 2009

Может кто-нибудь предложить помощь?

Не надо. Найдите другую схему быстрого обогащения. Или, по крайней мере, не полагайтесь на очистку экрана.

Там так много шансов, что это может пойти не так. Найдите другой способ получения информации для агрегирования. Используйте API, если они существуют, и храните расписания в базах данных (они редко меняются еженедельно). Локальное хранение ускоряет работу ваших клиентов, а также позволяет предоставлять больше услуг.

Вот лишь некоторые из потенциальных проблем с очисткой экрана:

  • Незначительные обновления сайтов, которые вы чистите, могут сломать ваш инструмент.
  • В попытках удаления IP-адреса вашего сервера может быть отказано.
  • В зависимости от информации, вы можете даже получить иск.
2 голосов
/ 02 мая 2011

Чтобы начать со соскоба, можно обратиться к сообщению -

http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-using.html (Простой Ruby Screen Scraper с использованием Mechanize, Hpricot и XPath)

http://rorguide.blogspot.com/2011/04/simple-ruby-screen-scraper-in-just-5.html (Простой Ruby Screen Scraper всего за 5 строк без использования XPath)

Это просто для понимания

0 голосов
/ 07 апреля 2013

кашель watir-webdriver (драгоценный камень)

ДОМ не может скрыть

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...