Случайные символы в ответе HTTP с использованием сокетов - PullRequest
4 голосов
/ 30 июня 2010

Я использую сокеты для создания POST-запроса к данному серверу. Ответ возвращается в основном нормально, и я использую InputStream с кодировкой «UTF-8» для чтения ответа с сервера. Большая часть ответа имеет смысл, и я могу правильно просматривать HTML, однако, на первый взгляд, я вижу такие коды, как «1ffa», «6e8», «1972», «90», «0» отдельные строки ответа, когда я его читаю. Вот как я создаю и читаю ответ.

    String hostname = "server";
    SocketFactory socketFactory = SSLSocketFactory.getDefault();
    Socket socket = new Socket(hostname, 8080);
   // Create streams to securely send and receive data to the server
    InputStream in = socket.getInputStream();
    OutputStream out = socket.getOutputStream();
    PrintWriter writer = new PrintWriter(out);
    writer.println("POST /handlerServlet http/1.1");
    writer.println("Host: " + hostname);
    String parameters="params=" + URLEncoder.encode("paramsToEncode", "UTF-8"); 
    writer.println("Content-Length: " + parameters.length());
    writer.println("Content-Type: application/x-www-form-urlencoded");
    writer.println("Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7");
    writer.println("Keep-Alive: 115");
    writer.println("Connection: keep-alive");
    writer.println("\r\n" + parameters + "\r\n");
    writer.flush();
    // Read from in and write to out...
    String input = "";
    BufferedReader reader = new BufferedReader(new InputStreamReader(in, "UTF-8"));
    StringBuffer result = new StringBuffer();
    boolean startWriting = false;
    FileOutputStream outStream1 = new FileOutputStream(new File("/file1.txt"));
    Writer outWriter = new OutputStreamWriter(outStream1, "UTF-8");

    while ( (input = reader.readLine()) != null) {
    result.append(input);
    outWriter.write(input + "\n");
    result.append('\n');
    }
    System.out.println(result.toString());
    outWriter.close();
    // Close the socket
    in.close();

Кто-нибудь знает, почему я вижу такие символы?

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<base href="http://server:8080/HW/YX+JpCEnNDe5B87CCyFj5KR7z9rqlwRK77aMm/44221331.htm">

1ffa

<meta http-equiv="Content-Type"  content="text/html; charset=ISO-8859-1">
<title></title>
</head>
<body bgcolor="#ffffff">
<!-- Created by Oracle Reports 21:14 Tue Jun 29 09:14:32 PM, 2010 -->
....
<tr valign=top>
  <td height=10></td>
  <td width=80 colspan=3 align=center><font size=2 face="helvetica">V002A050001</font></td>
  <
1ffa
td></td>

Как вы можете видеть, появление этих символов в случайных местах может привести к некоторому хекктическому поведению в HTML-коде.

Спасибо.

1 Ответ

8 голосов
/ 30 июня 2010

Получаете ли вы заголовок в вашем ответе, который говорит что-то вроде этого?

Transfer-Encoding: chunked

В этом случае, скорее всего, это связано с HTTP Chunked Transfer Encoding . Это нормально.

...