Может быть проще в Python.Вот скрипт, который читает текстовый файл и создает два выходных файла: один с низким ASCII и один со всем остальным.Если у вас есть поддержка Python, скомпилированная в Vim, из Vim также можно использовать следующее (с минимальными изменениями).
import codecs
mixedInput = codecs.open('mixed.txt', 'r', 'utf-8')
lowAsciiOutput = codecs.open('lowAscii.txt', 'w', 'utf-8')
otherOutput = codecs.open('other.txt', 'w', 'utf-8')
for rawline in mixedInput:
line = rawline.rstrip()
for c in line:
if ord(c) < 2**7:
lowAsciiOutput.write(c)
else:
otherOutput.write(c)
otherOutput.write('\n')
lowAsciiOutput.write('\n')
mixedInput.close()
lowAsciiOutput.close()
otherOutput.close()
пример входного файла (mixed.txt):
欢迎来到Mifos管理区域
Делает ли это то, что вы хотите?
Также сохраняется как гист: https://gist.github.com/855545