Как я могу отсканировать страницу веб-почты? - PullRequest
0 голосов
/ 17 апреля 2009

Я делаю проект, в котором мне нужно войти на сайт и очистить содержимое веб-страницы. я попробовал следующий код:

protected void Page_Load(object sender, EventArgs e)
{
    WebClient webClient = new WebClient();
    string strUrl = "http://www.mail.yahoo.com?username=sakthivel123&password=operator&login=1";
    byte[] reqHTML;
    reqHTML = webClient.DownloadData(strUrl);
    UTF8Encoding objUTF8 = new UTF8Encoding();
    Label1.Text = objUTF8.GetString(reqHTML1);
}

Это очищает страницу входа в почту. Но мне нужно очистить свои входящие данные. Пожалуйста, проинструктируйте меня, как действовать дальше, заранее спасибо.

Ответы [ 3 ]

1 голос
/ 17 апреля 2009

Пожалуйста, посмотрите это вопросы и связанные с ними вопросы. Мы должны изучить исходный HTML-код веб-страницы, прежде чем мы сможем правильно ее удалить. Поэтому войдите в систему вручную и получите исходный код страницы входящих сообщений, а затем изучите его, чтобы очистить.

Почему вы не используете Yahoo Mail API ? Что является лучшим решением.

0 голосов
/ 17 апреля 2009

Я бы посоветовал вам сначала использовать инструмент под названием Fiddler для анализа связи между целевым сайтом и вашим браузером. Вы можете просмотреть все заголовки http, файлы cookie, контент и т. Д.

Как только ваш объект webClient сможет повторить действия браузера, включая вход в систему, настройку соответствующих файлов cookie и т. Д., Вы можете автоматизировать процедуру.

И, наконец, когда у вас есть нужный HTML, используйте регулярные выражения для извлечения из него необходимой информации.

0 голосов
/ 17 апреля 2009

См. Этот вопрос - Написание программы на C #, которая сканирует веб-сайт электронной коммерции и извлекает фотографии продуктов + цены + описание из них

P.S .: Это называется "очистка", и сам процесс выполнения очистки экрана будет называться (как вы уже догадались!) "Очистка экрана". Слово «лом» при использовании в качестве глагола означает «отбросить» - например, «проект был отменен!» ; -)

...