Eclipse превращает японцев в мусор во время рефакторинга - PullRequest
3 голосов
/ 28 мая 2011

У меня есть несколько файлов Java, в которых есть японские строки, и они закодированы в UTF-8.Я использую Eclipse.Однако, когда Eclipse касается их любым автоматическим способом, это превращает японцев в мусор.Хорошим примером этого является JAWJAW , интерфейс Java японского WordNet.Вы можете увидеть код на сайте с японскими символами.Однако, если вы загрузите проект в Eclipse, все не получится, потому что символы искажены (bakemoji).

Кто-нибудь знает, как это исправить?

Ответы [ 2 ]

3 голосов
/ 28 мая 2011

Какая кодировка по умолчанию для вашего проекта?
Будущая версия Eclipse (например, e4) может быть по умолчанию установлена ​​в UTF-8, что позволит избежать автоматического преобразования в «мусор».

См. ошибка 108668 для получения дополнительной информации об этом отражении:

Ни одно решение не будет идеальным.Однако в долгосрочной перспективе я думаю, что текущий подход к конкретной платформе явно уступает независимому от платформы стандартному UTF-8.


+ 1 UTF-8 должен быть очевидным набором символов по умолчанию для всех текстовых файлов, у меня была проблема с затмением, когда я использовал английскую систему Windows XP и пыталсяоткройте файл в затмении с китайскими иероглифами, как вы можете себе представить, что дисплей полностью запутался, а затмение не говорит мне, что мне нужно делать.
Мне пришлось потратить время на поиск ответов в Google.Мне пришлось поставить -Dfile.encoding=UTF-8 в eclipse.ini, чтобы он вел себя правильно.


Установка UTF-8 по умолчанию не является правильным решением дляпроблема, с которой вы столкнулись.


+ 1 для встраивания кодировки в поток символов везде, где мы можем (например, XML, HTTP, некоторые виды файловых систем). Кодировка является мета-информацией для данных и относится к данным, а не к отдельной изменяемой пользователем настройке .

0 голосов
/ 30 января 2013

Основная причина этой причины - шрифт, поддерживаемый юникодом, отсутствует в системных шрифтах. Поэтому сделайте следующее, чтобы сделать это.

  • Загрузите шрифт Arial Unicode MS и поместите его внутрь windows->fonts каталог в windows.
  • Измените кодировку текста по умолчанию в Eclipse на UTF-8, перейдя к

    Окно-> Настройки-> Общие-> Рабочая область-> Кодировка текстовых файлов -> Другие-> UTF-8

  • установить шрифт Arial Unicode MS для атрибута Text Font, перейдя к

    Окно-> Настройки-> Общее-> Общее-> Внешний вид-> Цвета и Шрифты-> Основные-> Текстовый шрифт (выберите его) -> Редактировать

...