Думал, что добавлю дополнительный ответ из-за проблемы, с которой столкнулся.Если вы хотите, чтобы символы UTF-8 не терялись, вам нужно:
set plain_text to do shell script "echo " & quoted form of ("<!DOCTYPE HTML PUBLIC><meta charset=\"UTF-8\">" & html_string) & space & "| textutil -convert txt -stdin -stdout"
Вам нужно добавить метатег <meta charset=\"UTF-8\">
, чтобы textutil воспринимал это как документ utf-8.