Я использую сокеты для создания POST-запроса к данному серверу. Ответ возвращается в основном нормально, и я использую InputStream с кодировкой «UTF-8» для чтения ответа с сервера. Большая часть ответа имеет смысл, и я могу правильно просматривать HTML, однако, на первый взгляд, я вижу такие коды, как «1ffa», «6e8», «1972», «90», «0» отдельные строки ответа, когда я его читаю. Вот как я создаю и читаю ответ.
String hostname = "server";
SocketFactory socketFactory = SSLSocketFactory.getDefault();
Socket socket = new Socket(hostname, 8080);
// Create streams to securely send and receive data to the server
InputStream in = socket.getInputStream();
OutputStream out = socket.getOutputStream();
PrintWriter writer = new PrintWriter(out);
writer.println("POST /handlerServlet http/1.1");
writer.println("Host: " + hostname);
String parameters="params=" + URLEncoder.encode("paramsToEncode", "UTF-8");
writer.println("Content-Length: " + parameters.length());
writer.println("Content-Type: application/x-www-form-urlencoded");
writer.println("Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7");
writer.println("Keep-Alive: 115");
writer.println("Connection: keep-alive");
writer.println("\r\n" + parameters + "\r\n");
writer.flush();
// Read from in and write to out...
String input = "";
BufferedReader reader = new BufferedReader(new InputStreamReader(in, "UTF-8"));
StringBuffer result = new StringBuffer();
boolean startWriting = false;
FileOutputStream outStream1 = new FileOutputStream(new File("/file1.txt"));
Writer outWriter = new OutputStreamWriter(outStream1, "UTF-8");
while ( (input = reader.readLine()) != null) {
result.append(input);
outWriter.write(input + "\n");
result.append('\n');
}
System.out.println(result.toString());
outWriter.close();
// Close the socket
in.close();
Кто-нибудь знает, почему я вижу такие символы?
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
<base href="http://server:8080/HW/YX+JpCEnNDe5B87CCyFj5KR7z9rqlwRK77aMm/44221331.htm">
1ffa
<meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1">
<title></title>
</head>
<body bgcolor="#ffffff">
<!-- Created by Oracle Reports 21:14 Tue Jun 29 09:14:32 PM, 2010 -->
....
<tr valign=top>
<td height=10></td>
<td width=80 colspan=3 align=center><font size=2 face="helvetica">V002A050001</font></td>
<
1ffa
td></td>
Как вы можете видеть, появление этих символов в случайных местах может привести к некоторому хекктическому поведению в HTML-коде.
Спасибо.