C # Как извлечь данные из сайта ASP + Javascript - PullRequest
0 голосов
/ 05 января 2010

Я хочу создать C # программу, которая бы извлекала некоторые данные с сайта. Этот сайт - букмекерская контора: bet365.com/home/ и мне нужно получить:

  1. название конкретного рынка + шансы (пример: Футбол - Премьер-лига Barclays - Сток против Фулхэма - 2,75 | 3,20 | 2,62)
  2. другой рынок + шансы (пример: скачки - Лингфилд - 12:30 - 3,2 | 4,3 | 5,2 | 6,7 | 8,62 | ..)
  3. есть также другой формат коэффициентов (десятичный, дробный, американский), мне нужно выбрать десятичную

Но когда я открываю этот сайт в виде текстового файла - все эти данные отсутствуют - поэтому я не могу просто разобрать его с помощью HTML-парсера. Мне нужен совет - каков наилучший способ извлечь данные из такого рода веб-страниц?

Ответы [ 2 ]

0 голосов
/ 07 января 2010

Скорее всего, данные загружаются через AJAX. Это означает, что загружаемая вами HTML-страница содержит в основном статический контент. После отображения HTML-кода данные загружаются с другого URL-адреса. Вы можете использовать Firebug для анализа загружаемых данных.

Если у вас есть URL-адрес, теперь вы можете очистить этот URL-адрес для данных, которые вам нужны. Как правило, очистка извлекает необработанный текст и использует регулярные выражения.

0 голосов
/ 05 января 2010

То, что вы пытаетесь сделать, называется Очистка (или очистка веб-страниц).

Вам придется немного почитать, чтобы узнать о различных методах. Там, конечно, не простой способ сделать это.

Я бы также рискнул предположить, что на сайте ставок есть меры, которые не позволят вам сделать это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...