Как проверить текст как не тарабарщина в PHP? - PullRequest
2 голосов
/ 27 июня 2011

Каков наилучший способ проверки строки как не тарабарщины с использованием PHP?

Например, если я получаю ввод строки от пользователя, который должен быть длиной не менее 250 символов, как я могу определить,они вводили правильный текст (например, настоящие слова) или просто тарабарщину, чтобы соответствовать минимальному количеству символов (например, asdlfkjefksjlfkjldskfjelkef)?

Я думал о подсчете количества слов как одной опции, но пользователь все еще мог бы выделитьих тарабарщина (например, asdlf kjef ksjlf kjl dskfje lkef), поэтому требуется еще один вид проверки поверх этого.

Есть ли способ проверить, что хотя бы половина строки содержит реальные словарные слова или что-тона этот счет?

Как лучше всего решить эту проблему?

Спасибо.

Ответы [ 4 ]

5 голосов
/ 27 июня 2011

Вы не можете сделать это должным образом, потому что Бесцветные зеленые идеи яростно спят .

1 голос
/ 27 июня 2011

Вы можете пройтись по своему словарю и удалить все слова из словаря из пользовательского ввода, а затем проверить длину остальных

1 голос
/ 27 июня 2011

Вы можете посмотреть на Марковские цепи .Проще говоря, идея заключается в том, что этот алгоритм определяет, выглядят ли последовательности символов как будто они принадлежат друг другу.Он не обязательно скажет вам, что это не бред, но он должен ловить такие вещи, как "ksjhglah и т. Д.".

См. Марковские текстовые генераторы

1 голос
/ 27 июня 2011

Вы можете попробовать Фильтр Блума

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...