У меня есть некоторые данные, которые выглядят следующим образом в кадре данных:
Japanese
--------
明日|Adverb の 天気|Weather は なんですか
Здесь 明日 помечен наречием, а 天 with помечен погодой.
Используя Pandas и regex, яЯ ищу способ добавить {}
вокруг символов, которые имеют японский язык, трубу и английский, но не только вокруг японского.Я пытался использовать регулярные выражения со следующим, но получаю синтаксическую ошибку:
df. ['Japanese'] = df ['Japanese']. Str.append ('(. +? \| [A-Za-z _] +) \ ',' {(. +? \ | [A-Za-z _] +)} ')
Требуемый вывод следующий (такжеищу способ удалить все пробелы одновременно ... если это невозможно, я могу сделать это потом):
Japanese
--------
{明日|Adverb}の{天気|Weather}はなんですか
Спасибо!