Быстрый, кросс-платформенный текстовый редактор с поддержкой Unicode, который показывает невидимые объекты, такие как ZWSP? - PullRequest
3 голосов
/ 24 апреля 2010

Наш рабочий процесс публикации включает компьютеры под управлением Windows и Linux (также есть некоторые Mac, но они не включены в рабочий процесс критического пути). Многие тексты включают в себя как английский, так и кхмерский языки и размечены в XML.

XML Copy Editor - лучший кроссплатформенный редактор XML с открытым исходным кодом, который я обнаружил. Он использует компонент редактирования Scintilla, который в целом хорош для Unicode, но не позволяет отображать непечатаемые или невидимые символы, такие как U + 200B (пробел нулевой ширины) и U + 200C (не соединяющий нулевой ширины). Кхмерский язык не разделяет слова пробелом, как это делают западные языки, поэтому ZWSP используется в электронных текстах, чтобы приложения могли легко разбивать строки.

В идеале я бы отредактировал разметку и содержимое в одном редакторе, но понимание XML иногда менее важно, чем возможность отображать невидимые элементы. ( OpenOffice.org Writer и Microsoft Word - единственные известные мне приложения, которые будут отображать ZWSP. Они не подходят для разметки и манипуляций с текстом, которые необходимо выполнить для подготовки рукописей. для публикации, к сожалению, хотя я думаю, что они хороши для авторской разработки.)

На прошлой неделе я опробовал многообещающий редактор, но операция поиска и замены регулярных выражений, которая заняла менее секунды в TextPad 4.7.3, продолжалась более двадцати секунд. Поэтому я хочу отметить, что скорость и способность обрабатывать большие (до 150 МБ) файлы также являются проблемой.

Существует ли хороший, быстрый, бесплатный или не слишком дорогой текстовый редактор с версиями для Windows и Linux и, возможно, для Mac, поддерживающими Unicode и способными отображать невидимые объекты, такие как ZWSP? Он имеет подсветку синтаксиса, может обрабатывать большие файлы и достаточно настраиваем, чтобы я не вырвал волосы в отчаянии?

Ответы [ 3 ]

0 голосов
/ 25 апреля 2010

EditPad Pro (пока) не имеет возможности визуализировать непечатные символы, кроме пробела и вкладки ASCII. Версия 6 распознает ZWSP как границу слова при выполнении переноса слов и выборе слов двойным щелчком или Ctrl + Shift + Влево / Вправо.

Что вы можете сделать, это найти регулярное выражение \u200B. Хотя это не делает пространство нулевой ширины видимым, оно выберет его и поставит курсор после него. Вы можете использовать регулярное выражение \u200B\X и включить кнопку «Выделить» на панели поиска, чтобы выделить каждую графему после U + 200B. Вы даже можете использовать редактор схем раскраски синтаксиса для редактирования предоставленной схемы XML, чтобы использовать это регулярное выражение, всегда выделяя каждую графему после U + 200B.

EditPad Pro легко обрабатывает файлы размером 150 МБ и имеет мощный механизм регулярных выражений (такой же, как в RegexBuddy и PowerGREP). Максимальный размер файла составляет 2 ГБ. Только для Windows.

0 голосов
/ 03 мая 2010

Я использую CKEditor , он кроссплатформенный и полностью поддерживает Unicode.

Взгляните на это

0 голосов
/ 24 апреля 2010

Я не знаю, в частности, о ZWSP, но EditPadPro - это хорошо, быстро, не дорого, имеет очень хороший механизм регулярных выражений и поддерживает Unicode (и хорошо подходит для редактирования XML, тоже ). Разработчик (Ян Гойваэртс) живет в Таиланде и знает о требованиях для восточных сценариев и языков, поэтому велика вероятность, что он сможет обрабатывать эти тексты.

...