Для общего решения Text :: Unidecode транслитеруйте практически все, что на него брошено, в чистый US-ASCII.
Так что в вашем случае это будет работать:
perl -C -MText::Unidecode -n -i -e'print unidecode( $_)' unicode_text.txt
-C существует, чтобы убедиться, что ввод читается как utf8
Преобразует это:
l'été est arrivé à peine après aôut
¿España es un paìs muy lindo?
some special chars: » « ® ¼ ¶ – – — Ṉ
Some greek letters: β ÷ Θ ¬ the α and ω (or is it Ω?)
hiragana? みせる です
Здравствуйте
السلام عليكم
в это:
l'ete est arrive a peine apres aout
?Espana es un pais muy lindo?
some special chars: >> << (r) 1/4 P - - -- N
Some greek letters: b / Th ! the a and o (or is it O?)
hiragana? miseru desu
Zdravstvuitie
lslm `lykm
Последний показывает пределы модуля, который не может вывести гласные и получить as-salaamu `alaykum из оригинального арабского языка. Это все еще довольно хорошо, я думаю