Регулярное выражение для соответствия хэштегам на английском и китайском - PullRequest
0 голосов
/ 07 января 2019

Я пытаюсь написать регулярное выражение для извлечения содержимого хэштега на английском и китайском языках. Хэштеги на китайском языке обозначаются иначе, чем хэштеги на английском языке. Используются два символа хэштега, и содержимое помещается прямо между ними, например #中国#. Кроме того, пробелы не используются на китайском языке. Примером является

我来自#中国#。

Соответствующее предложение на английском языке:

I'm from #China.

Можно ли написать одно регулярное выражение для извлечения хэштегов на этих двух языках? Если да, то как?

1 Ответ

0 голосов
/ 07 января 2019
string = "我来自#中国#。 I'm from #China."        
string.scan(/#\w+|#\p{Han}+#/)
=> ["#中国#", "#China"]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...