Question

Я пытаюсь написать строку кода, которая займет строку японского текста и удалит определенный набор символов. Однако у меня возникли проблемы с использованием символов Юникода внутри регулярного выражения.

Я сейчас использую text.gsub(/《.*?》/u, ''), но получаю ошибку

'gsub': invalid byte sequence in Windows-31J (Argument error)

Может кто-нибудь сказать мне, что я делаю неправильно?

Пример текста: 100 の仕草《しささああり無無造作む 100 100 100

Ожидаемый результат: 101 の仕草があまりに造作造作たた 101 101

Спасибо

edit: # encoding: utf-8 присутствует вверху скрипта.

Как вы используете символы Юникода в регулярном выражении в Ruby?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как вы используете символы Юникода в регулярном выражении в Ruby?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов