Если у вас есть доступ к Perl, то это относительно просто:
perl -ne 'binmode STDOUT,":utf8";s/&#([0-9]*);/pack("U",$1)/eg;print' \
document.html
Пример:
#!/bin/bash
html2utf8() {
perl -ne 'binmode STDOUT, ":utf8"; s/&#([0-9]*);/pack("U",$1)/eg; print'
}
echo 'testing 1 ā 2 Ĭ 3 ē' | html2utf8
Производит:
testing 1 ā 2 Ĭ 3 ē