Если вы не против запустить реальный браузер и не хотите ставить зависимость от SeleniumRC (что требуется для C #), вы можете использовать WatiN .Ниже приведен небольшой пример от WatiN.
[Test]
public void SearchForWatiNOnGoogle()
{
using (var browser = new IE("http://www.google.com"))
{
browser.TextField(Find.ByName("q")).TypeText("WatiN");
browser.Button(Find.ByName("btnG")).Click();
Assert.IsTrue(browser.ContainsText("WatiN"));
}
}
Или, если вы не хотите запускать настоящий браузер на компьютере, вы можете попробовать Selenium и HtmlUnit.С Selenium вы запускаете HtmlUnit, говорите ему загружать данную страницу и читаете то, что вам нужно, через xpath.Например, это пример из документации Selenium как сделать нечто подобное:
using OpenQA.Selenium;
using OpenQA.Selenium.Remote;
class Example
{
static void Main(string[] args)
{
ICapabilities desiredCapabilities = DesiredCapabilities.HtmlUnit();
IWebDriver driver = new RemoteWebDriver(desiredCapabilities);
driver.Navigate().GoToUrl("http://google.ca/");
IWebElement element = driver.FindElement(By.Name("q"));
element.SendKeys("Cheese!");
element.Submit();
System.Console.WriteLine("Page title is: " + driver.Title);
driver.Quit();
System.Console.ReadLine();
}
}
Кстати, с селеном вы также можете использовать настоящий браузер.Эта страница с результатами является локальным файлом, вы просто читаете файл и фильтруете нужные данные.