TextPad и Unicode: полная поддержка? - PullRequest
15 голосов
/ 16 января 2012

У меня есть некоторые файлы UTF-8, созданные на Mac, и при попытке открыть их с помощью TextPad в Windows я получаю следующее предупреждение:

ПРЕДУПРЕЖДЕНИЕ: (имя файла) содержит символыкоторые не существуют в кодовой странице 1252 (ANSI Latin 1).Они будут преобразованы в системный символ по умолчанию, если вы нажмете ОК.

Linux (GNOME gEdit) может открыть тот же файл без жалоб.Что значит выше?Я думал, что TextPad имеет полную поддержку UTF-8.Могу ли я безопасно открывать и редактировать файлы UTF-8, используя его, не повреждая файл?

Ответы [ 7 ]

11 голосов
/ 16 января 2012

Кажется, что TextPad не может обрабатывать символы вне windows-1252 (CP1252, здесь используется неправильное обозначение «ANSI Latin 1»).Я протестировал его в Windows, открыв простой текстовый файл, созданный в той же системе, что и кодированный UTF-8, как с BOM, так и без нее, с тем же результатом.Похоже, что справка программы не содержит ничего, связанного с кодировкой символов, а ее инструменты для написания «международных символов» предназначены только для символов Latin-1.

Существует несколько текстовых редакторов для Windows, которые могут работать с UTF-8 (даже Блокнот может открыть файл UTF-8, но его вряд ли можно рекомендовать для серьезного редактирования).См. Коллекцию информации Алана Вуда о редакторах Unicode и текстовых редакторах для Windows .(Лично мне нравится Notepad ++ и BabelPad, которые бесплатны.)

8 голосов
/ 29 января 2016

TextPad 8, новейшая по состоянию на 2016-01-28, окончательно должным образом поддерживает BMP Unicode.Это платное обновление, но пока оно работает для меня безупречно.

6 голосов
/ 16 января 2012

TextPad ‘поддерживает документы UTF-8 и UTF-16 только в той степени, в которой они импортируют и экспортируют их. Но он по-прежнему редактирует файлы как простые байты, а не символы Юникода (используя кодовую страницу ANSI, которая является кодовой страницей 1252 для западноевропейских стран).

Таким образом, если файл не содержит только символы, которые также существуют в этой кодовой странице, вы потеряете содержимое. Это скорее побеждает точку Unicode.

Действительно, это была проблема, которая заставила меня бежать - в EmEditor, в то время, хотя теперь я соглашусь с предыдущими комментариями и рекомендую Notepad ++. Эра оплаты текстовых редакторов давно прошла.

5 голосов
/ 07 ноября 2013

На самом деле TextPad поддерживает отображение кодовых точек Unicode, если они поступили неправильно. Чтобы отобразить символы Юникода, вы должны выбрать Configure-> Preferences и развернуть "Классы документов-> Text-> Font.

Вам необходимо выбрать шрифт Unicode и установить соответствующий скрипт. Например. Arial Unicode MS со скриптом CHINESE_BIG5.

Однако это обратный подход, поскольку приложение должно обрабатывать это, когда пользователь говорит TextPad открыть файл в Unicode или UTF-8. Встроенное приложение Notepad с MS Windows автоматически определит кодировку и правильно отобразит глифы на основе кодировки.

3 голосов
/ 02 апреля 2012

Я нашел обсуждение этого на форумах Textpad: http://forums.textpad.com/viewtopic.php?t=11019

В то время как у меня есть Notepad ++, Textpad легко обрабатывает большие файлы, в то время как другие редакторы, которые я пробовал, включая Notepad ++, либо замедляют работу, либо умирают. В настоящее время я пытаюсь отредактировать файл размером 475 МБ, и Notepad ++ не справляется с этой задачей.

2 голосов
/ 14 августа 2018

Меню настройки текстовой панели -> Настройки -> Классы документов -> По умолчанию -> Кодировка по умолчанию -> UTF-8

0 голосов
/ 15 декабря 2012

Попробуйте установить код ANSI с помощью File / Open, который должен решить проблему в TextPad

...