PHP / Python / C / C ++ библиотека / приложение, чтобы соответствовать / исправить / дать предложения для ввода - PullRequest
1 голос
/ 30 января 2010

Мне бы хотелось иметь простую и легкую библиотеку / приложение на PHP / Python / C / C ++, библиотеку / приложение для сопоставления / исправления / предложения предложений для ввода. Пример входа / выхода:

  1. Ввод: веб-разработка ==> Ввод: веб-разработка
  2. Входные данные: веб-разработка ==> Выходные данные: веб-разработка
  3. Входные данные: веб-разработка ==> Выходные данные: веб-разработка

Учитывая, что есть база правильных слов и фраз, мне просто нужна библиотека, чтобы сопоставить / угадать фразы. Пожалуйста, предложите, если вы знаете что-либо.

Ответы [ 2 ]

3 голосов
/ 06 февраля 2010

Как написать корректор орфографии от директора Google Resarch Питера Норвика содержит корректор орфографии в 21 строке Python, дополненный пояснениями.

Вам придется преобразовать это в модуль самостоятельно, но это должно быть легко. Конечно, вам также понадобится корпус (то есть слова), но он также дает источники для этого.

3 голосов
/ 03 февраля 2010

Я думаю, что вы хотите сделать, это вычислить расстояние редактирования между строками (входная, выходная пара). Один из более простых (который я использовал для определения полного названия команды из 3-буквенного короткого - это длинная история) - это расстояние Левенштейн . Последняя внешняя ссылка на странице имеет несколько различных реализаций (оказывается, она стандартна в PHP 4.0.1 +).

...