Кодировка Java UTF-8 из URL - PullRequest
       21

Кодировка Java UTF-8 из URL

0 голосов
/ 29 октября 2011

У меня проблема с некоторыми символами в кодировке UTF-8. Я читаю index.html из http://wordki.pl, чтобы получить список наборов слов с их именем.

это выглядит так

<a href="THE LINK.html">THE NAME</a><span>(20)</span><img src="krecha.png">

и когда ИМЯ имеет "Ł", оно делает работу и помещает туда "??" но "??" это не признак того, что я могу изменить с replaceAll ("str", "str"), потому что моя консоль только что показала скрытый за ней символ

Но когда я просматриваю источник в chrome / firefox и т. Д., Он показывает "Ł". И все другие забавные знаки вроде «ó, ł,,, ś» отлично работают в моей программе.

Поэтому я спрашиваю, есть ли способ изменить "??" в "Ł"? Я попытался закодировать его побайтово, но затем я потерял все остальные знаки, такие как «ó, ł, ą» и т. Д.

РЕДАКТИРОВАТЬ: Хорошо, я решил проблему Мне нужно было сохранить мой * .java файл как UTF-8: O

1 Ответ

0 голосов
/ 29 октября 2011

Вы должны установить страницу тип контента как "UTF-8"

Сделайте что-то вроде этого:

request.getCharacterEncoding() = ISO-8859-1 
response.getCharacterEncoding() = UTF-8 
request.getParameter("query") = déjeuner

ИЛИ

  if(null == request.getCharacterEncoding())       
     request.setCharacterEncoding(encoding); 

  response.setContentType("text/html; charset=UTF-8");  
  response.setCharacterEncoding("UTF-8");

Для получения дополнительной информации см. Этот URL:

Как заставить UTF-8 работать в веб-приложениях на Java?

<meta http-equiv="Content-Type" content="text/html;charset=utf-8"> 
...