Ваши тиковые символы не входят в 7-битный набор символов ASCII, поэтому здесь есть целая кроличья нора для кодировки символов.Но быстрое и грязное решение состоит в том, чтобы захватить все, что находится между расширенными символами.
($result) = $str =~ /[^\0-\x7f]+(.*?)[^\0-\x7f]/;
[^\0-\x7f]
соответствует символам со значениями символов не от 0 до 127, т. Е. Всем, что не является 7-битным символом ASCIIвключая новые строки, вкладки и другие последовательности управления.Это регулярное выражение будет работать независимо от того, является ли ваш вход кодированным в UTF-8 или уже декодировано, и может работать и для других кодировок символов.