Информация о сайте с использованием c # - PullRequest
0 голосов
/ 23 июня 2011

Я занимаюсь разработкой библиографического приложения с использованием форм c # windows.У меня есть панель с информацией об источнике веб-страницы и кнопка рядом с URL-адресом, так что, когда пользователь нажимает эту кнопку, я могу получить такую ​​информацию, как «Год изменения», «Автор» страницы и т. Д.сделать это?

Спасибо

Ответы [ 3 ]

0 голосов
/ 23 июня 2011

Хотя ваш вопрос не очень понятен ... Я предполагаю, что вы хотите извлечь информацию с веб-страницы. Вам нужно знать структуру страницы, а затем анализировать HTML. Вы можете искать конкретные элементы, например, метку или текстовое поле с именем author , например.

0 голосов
/ 23 июня 2011

Вам понадобится HTMLAgilityPack , (найдите нужный XML-файл, используя Firebug Addon для Firefox), затем запустите некоторый код по следующим строкам:

    private void PageScrape(string url)
    {
        var webGet = new HtmlWeb();
        var document = webGet.Load(url);
        var date = document.DocumentNode.SelectSingleNode(".//*[@class='Article_Date']");
            if (date != null)
            {
               goodBox.Text += date.InnerText;
            }
            else
            {
               goodBox.Text += "whoops!";
            }
        }

Если у вас есть конкретный веб-сайт, я могу привести более конкретный пример кода.

0 голосов
/ 23 июня 2011

Вы можете получить содержимое веб-страницы, например

using System.Net;
using System.Windows.Forms;

string url = "http://www.google.com";
string result = null;

    WebClient client = new WebClient();
    result = client.DownloadString( url );

Позже вы сможете узнать необходимую информацию.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...