Как войти на сайт? - PullRequest
       20

Как войти на сайт?

2 голосов
/ 15 сентября 2009

Я хочу войти в ORKUT через Java-программу. Я использую следующую программу, чтобы сделать это. Я скопировал его с какого-то сайта. Теперь я хочу использовать его для ORKUT . Но у меня есть несколько вопросов относительно некоторых строк.

Q1. Где дать URL страницы входа в систему (я думаю, в новом HTTPGET ("....."))? Я прав или нет?

Q2. Какой аргумент передать конструктору HTTPPost (""). Если нам нужно передать значение атрибута «action» элемента «form» в html-источнике веб-страницы входа в систему, подтвердите его.

Q3. Элемент формы страницы входа в ORKUT имеет атрибут

onsubmit="return(gaia_onLoginSubmit());"

Нужны ли какие-либо изменения в следующем коде из-за наличия вышеуказанного атрибута?

Q4. Как я могу получить html источник веб-страниц после входа в систему?

import java.util.ArrayList;
import java.util.List;
import org.apache.http.HttpEntity;
import org.apache.http.HttpResponse;
import org.apache.http.NameValuePair;
import org.apache.http.client.entity.UrlEncodedFormEntity;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.client.methods.HttpPost;
import org.apache.http.cookie.Cookie;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.message.BasicNameValuePair;
import org.apache.http.protocol.HTTP;


public class ClientFormLogin {

public static void main(String[] args) throws Exception {

    DefaultHttpClient httpclient = new DefaultHttpClient();

    HttpGet httpget = new HttpGet("https://www.google.com/accounts/ServiceLogin?service=orkut&hl=en-US&rm=false&continue=http%3A%2F%2Fwww.orkut.com%2FRedirLogin%3Fmsg%3D0%26page%3Dhttp%253A%252F%252Fwww.orkut.co.in%252FHome.aspx&cd=IN&passive=true&skipvpage=true&sendvemail=false");

    HttpResponse response = httpclient.execute(httpget);
    HttpEntity entity = response.getEntity();

    System.out.println("Login form get: " + response.getStatusLine());
    if (entity != null) {
        entity.consumeContent();
    }
    System.out.println("Initial set of cookies:");
    List<Cookie> cookies = httpclient.getCookieStore().getCookies();
    if (cookies.isEmpty()) {
        System.out.println("None");
    } else {
        for (int i = 0; i < cookies.size(); i++) {
            System.out.println("- " + cookies.get(i).toString());
        }
    }

    HttpPost httpost = new HttpPost("https://www.google.com/accounts/ServiceLoginAuth?service=orkut");

    List <NameValuePair> nvps = new ArrayList <NameValuePair>();
    nvps.add(new BasicNameValuePair("Email", "username"));
    nvps.add(new BasicNameValuePair("Passwd", "password"));

    httpost.setEntity(new UrlEncodedFormEntity(nvps, HTTP.UTF_8));

    response = httpclient.execute(httpost);
    entity = response.getEntity();

    System.out.println("Login form get: " + response.getStatusLine());
    if (entity != null) {
        entity.consumeContent();
    }

    System.out.println("Post logon cookies:");
    cookies = httpclient.getCookieStore().getCookies();
    if (cookies.isEmpty()) {
        System.out.println("None");
    } else {
        for (int i = 0; i < cookies.size(); i++) {
            System.out.println("- " + cookies.get(i).toString());
        }
    }

    // When HttpClient instance is no longer needed, 
    // shut down the connection manager to ensure
    // immediate deallocation of all system resources
    httpclient.getConnectionManager().shutdown();        

1 Ответ

5 голосов
/ 15 сентября 2009

1:

Стандартный способ сделать это - HTTP POST для URL входа в систему с информацией для входа в качестве параметров в теле метода. Обычно это имя пользователя и пароль (или, возможно, хеш пароля).

Сеансовые куки могут быть получены из заголовков ответов (или их куки), а затем либо добавлены в качестве атрибутов к будущему HTTP GET для сайта, либо в качестве заголовков запросов.

2:

Я думаю, это зависит от сайта. Не уверен - попробуйте поработать с Firefox и расширением Live HTTP Headers.

Q3:

Вероятно, нет.

4:

используйте Method.getResponseBodyAsString OR Method.getResponseBody OR Method.getResponseBodyAsStream после HTTP GET для получения ответа, который будет содержать источник HTML для страницы.

...