Как сохранить запятую Unicode в Perl 5? - PullRequest
1 голос
/ 20 апреля 2019

Строка $ содержит запятую в Unicode.

use strict;
use utf8;

my $line = "Spy,qqq,Iwm";

$line =~ s/[^a-zA-Z u002cu002e]+//g;
print $line."\n";

Когда я ее запускаю, я получаю $ perl 1.pl

SpyqqqIwm

Есть предложения?

1 Ответ

6 голосов
/ 20 апреля 2019

Символ, о котором идет речь, это U + FF0C FULLWIDTH COMMA

Вы можете использовать его буквально.

s/[^a-zA-Z ,,.]+//g

В качестве альтернативы вы можете использовать один из следующих символов в двойных кавычках и в регулярных выражениях:

\N{U+FF0C}
\N{FULLWIDTH COMMA}
\x{FF0C}

Например,

s/[^a-zA-Z ,\N{U+FF0C}.]+//g
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...