Я пытаюсь разобрать HTML и автоматически изменить шрифт любых иностранных символов, и у меня возникли некоторые проблемы.Есть несколько различных хакерских способов, которыми я пытаюсь достичь этого, но ни один из них не работает действительно хорошо, и мне интересно, есть ли у кого-нибудь какие-либо идеи.Есть ли какой-нибудь простой способ с помощью python сопоставить все иностранные символы (в частности, японские кандзи / хиригана / катакана) с регулярными выражениями?То, что я использовал, является дополнением набора не чужеродных символов ([^ A-Za-z0-9 <> '"=]), но это не работает хорошо, и я боюсь, что это будетсопоставлять вещи, заключенные в <...>, что я не хочу делать.