У меня есть Perl-скрипт, который вызывается третьими лицами для отправки мне имен людей, которые зарегистрировали мое программное обеспечение. Одна из этих сторон кодирует имена в UTF-8, поэтому я соответствующим образом адаптировал свой скрипт для декодирования UTF-8 в ASCII с помощью Encode :: decode_utf8 (...).
Обычно это работает нормально, но каждые 6 месяцев или около того одно из имен содержит символы кириллицы, греческого или румынского алфавита, поэтому расшифровка имени приводит к появлению таких мусорных символов, как " ». Я должен связаться с клиентом и попросить у него «латинскую версию» его имени, чтобы выдать регистрационный код.
Итак, есть ли какой-нибудь модуль Perl, который может определять наличие таких символов и автоматически переводить их в их ближайшее ASCII-представление при необходимости?
Кажется, что я могу использовать Lingua :: Cyrillic :: Translit :: ICAO плюс Lingua :: DetectCharset для обработки кириллицы, но я бы предпочел что-то, что работает и с другими наборами символов.