Различные типы внимания, используемые при обработке естественного языка, при чтении литературы кажется, что эти внимания в значительной степени не отличаются друг от друга, тогда почему мы различаем эти уровни и типы внимания в архитектурах SOTA NLP