Как полагает Поло, такие инструменты, как dos2unix, могут быть очень полезны. Обратите внимание, что они могут быть в вашей системе Linux / Unix как fromdos или tofrodos , или, возможно, даже как набор инструментов общего назначения перекодировать .
Однако другой набор проблем, с которыми вы можете столкнуться, может быть связан с однобайтовыми / многобайтовыми кодировками символов. Если вы видите странные неожиданные символы (не в конце строки), то это может быть причиной. Особенно, если вы видите квадратные квадраты, вопросительные знаки, перевернутые вопросительные знаки, дополнительные символы или неожиданные символы с акцентом.
Выполнение команды locale в вашем * nix окне покажет вам, каков системный языковой стандарт. Если это отличается от кодировки, используемой в текстовых файлах, которые были переданы с компьютера Windows, то это может иногда вызывать проблемы, в зависимости от использования этих файлов. Вы можете использовать очень мощную команду recode , чтобы попытаться преобразовать различные кодировки, а также любые проблемы с окончанием строки. recode -l покажет вам все форматы и кодировки, между которыми инструмент может конвертироваться. Вероятно, это будет ОЧЕНЬ длинный список.
При записи в файлы или чтении из файлов (которые вы контролируете) часто стоит указывать используемую кодировку, поскольку большинство методов Java позволяют это. Однако, также гарантируя, что соответствие языкового стандарта системы может сэкономить много боли.