VIM: удаление не римских символов - PullRequest
2 голосов
/ 03 марта 2011

Я работаю с документом, содержащим как римские, так и азиатские символы, и хочу поместить их по одному в два отдельных файла и сохранить их первоначальную структуру, возможно ли это?

Спасибо

1 Ответ

0 голосов
/ 04 марта 2011

Может быть проще в Python.Вот скрипт, который читает текстовый файл и создает два выходных файла: один с низким ASCII и один со всем остальным.Если у вас есть поддержка Python, скомпилированная в Vim, из Vim также можно использовать следующее (с минимальными изменениями).

import codecs

mixedInput = codecs.open('mixed.txt', 'r', 'utf-8')
lowAsciiOutput = codecs.open('lowAscii.txt', 'w', 'utf-8')
otherOutput = codecs.open('other.txt', 'w', 'utf-8')

for rawline in mixedInput:
    line = rawline.rstrip()
    for c in line:
        if ord(c) < 2**7:
            lowAsciiOutput.write(c)
        else:
            otherOutput.write(c)
    otherOutput.write('\n')
    lowAsciiOutput.write('\n')

mixedInput.close()
lowAsciiOutput.close()
otherOutput.close()

пример входного файла (mixed.txt):

欢迎来到Mifos管理区域

Делает ли это то, что вы хотите?

Также сохраняется как гист: https://gist.github.com/855545

...