Есть ли что-то вроде регулярного выражения для замены многобайтовых символов на свои собственные?
т.е. у меня есть большой текстовый файл с такими символами:
漁魚京供侠競共
и я хочу заменить их следующим образом:
漁;
魚;
京;
供;
...
Как я могу сделать это, используя регулярное выражение?Я уже пробовал:
(.)
заменить на
\1;\n
, но это "разбивает" многобайтовые символы (то есть utf8) на один байт на строку (таким образом, один символ разделен на две строки),Для однобайтовых символов это прекрасно работает ... Любая помощь будет принята с благодарностью.