У меня есть наземные правдивые текстовые данные и их "шумный" аналог Мне нужно построить матрицы путаницы для орфографических ошибок add, del, sub и rev. Я могу сделать это, применяя расстояние Дамерау-Левенштейна, а затем перейти к полученной матрице, начиная с нижнего правого элемента, выстраивая правила редактирования при обратном просмотре матрицы. Есть ли библиотека Python, которая на самом деле это делает? Все инструменты, которые я нашел, рассчитывают только расстояние сходства, но они не обеспечивают правила редактирования.
Спасибо
Алессандро