NetBeans UTF8 Encoding Mess - инструмент для поиска исходных файлов в соответствии с его кодировкой и исправить их - PullRequest
1 голос
/ 18 декабря 2009

Я отредактировал несколько файлов исходных файлов php в кодировке ISO-8859-15 с помощью netbeans 6.7.1, но он преобразовал их (не спрашивая меня !!!!) в utf-8, и я потерял несколько немецких символов в этом процессе ...

Я ищу инструмент для поиска всех файлов в кодировке utf8 внутри каталога (мне сложно сказать, какой файл был поврежден).

Мне также нужен инструмент для их перевода

Я пытаюсь все исправить с помощью gedit, который распознает и уважает кодировку каждого файла, но не позволяет мне сохранять файлы utf8 как iso-8859-15, потому что там говорится, что символы не будут быть преобразованным ...

Итак, мне нужно:

  • инструмент для поиска файлов в кодировке utf8

  • редактор, позволяющий переходить от одной кодировки к другой

  • о да !, способ сказать netbeans не связываться с моими файлами !!!

(я уже пробовал с редактирование /etc/netbeans.conf и добавление -J-Dfile.encoding = UTF-8 или -J-Dfile.encoding = ISO-8859-15 без удачи) http://wp.uberdose.com/2007/05/07/netbeans-and-utf-8/ http://ditoinfo.wordpress.com/2007/02/26/netbeans-and-utf8-encoding-2/

спасибо большое

редактирование:

(ммм я только что нашел это http://wiki.netbeans.org/FaqI18nProjectEncoding который говорит, как изменить кодировку символов для проекта, я попробую здесь это объясняет беспорядок netbeans сделал

Для новой установки IDE, UTF-8 кодировка по умолчанию для новых проекты, как эта кодировка может обрабатывать любые символы Unicode, что делает его лучший выбор для большинства людей. Когда ты создать новый проект, IDE изначально по умолчанию дает ему та же кодировка, что и в последнем проекте который вы установите кодировку. если ты хочу другую кодировку, просто измени ее в диалоговом окне свойств.

и я создал новый проект из существующих источников php, я думаю, что это пошло не так ... )

1 Ответ

2 голосов
/ 28 января 2010

Я приму ваши очки по порядку:

  • Если вы немного знаете Python, я рекомендую lokking на decodeh.py . Он будет использовать стратегию наименьшего общего знаменателя. Таким образом, файлы iso-8859-15 могут быть распознаны как iso-8859-1, если ни один из их символов не находится вне области действия iso-8859-1. Я пробовал это на файлах utf-8, iso-8859-1 и iso-8859-15, и это в основном правильно. Он использует метку порядка байтов и эвристику, чтобы угадать кодировку.

  • Ответ на этот вопрос прост: emacs . Используйте M-xdescribe-current-coding-system, чтобы увидеть, что Emacs считает кодировкой файла. Emacs никогда не подводил меня в этом отношении. Используйте M-x set-buffer-file-coding-system, чтобы указать, какую кодировку буфера следует записать в файл с помощью.

  • Для netbeans 6.7 вы можете настроить кодировку по умолчанию для каждого проекта. Открыв проект, перейдите к Файл -> Свойства проекта , выберите Источники в левом меню и в нижней части правой панели. Вы увидите выпадающий список с названием «Кодировка»

...