Question

У меня есть наземные правдивые текстовые данные и их "шумный" аналог Мне нужно построить матрицы путаницы для орфографических ошибок add, del, sub и rev. Я могу сделать это, применяя расстояние Дамерау-Левенштейна, а затем перейти к полученной матрице, начиная с нижнего правого элемента, выстраивая правила редактирования при обратном просмотре матрицы. Есть ли библиотека Python, которая на самом деле это делает? Все инструменты, которые я нашел, рассчитывают только расстояние сходства, но они не обеспечивают правила редактирования.

Спасибо

Алессандро

Генерация правил редактирования с расстоянием Дамерау-Левенштейна

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Генерация правил редактирования с расстоянием Дамерау-Левенштейна

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы