Генерация правил редактирования с расстоянием Дамерау-Левенштейна - PullRequest
0 голосов
/ 28 января 2020

У меня есть наземные правдивые текстовые данные и их "шумный" аналог Мне нужно построить матрицы путаницы для орфографических ошибок add, del, sub и rev. Я могу сделать это, применяя расстояние Дамерау-Левенштейна, а затем перейти к полученной матрице, начиная с нижнего правого элемента, выстраивая правила редактирования при обратном просмотре матрицы. Есть ли библиотека Python, которая на самом деле это делает? Все инструменты, которые я нашел, рассчитывают только расстояние сходства, но они не обеспечивают правила редактирования.

Спасибо

Алессандро

...