Question

Я пытаюсь написать регулярное выражение для извлечения содержимого хэштега на английском и китайском языках. Хэштеги на китайском языке обозначаются иначе, чем хэштеги на английском языке. Используются два символа хэштега, и содержимое помещается прямо между ними, например #中国#. Кроме того, пробелы не используются на китайском языке. Примером является

我来自#中国#。

Соответствующее предложение на английском языке:

I'm from #China.

Можно ли написать одно регулярное выражение для извлечения хэштегов на этих двух языках? Если да, то как?

installero · Answer 1 · 07 января 2019

string = "我来自#中国#。 I'm from #China."        
string.scan(/#\w+|#\p{Han}+#/)
=> ["#中国#", "#China"]

Регулярное выражение для соответствия хэштегам на английском и китайском

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Регулярное выражение для соответствия хэштегам на английском и китайском

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов