Определить сложность английского слова - PullRequest
21 голосов
/ 28 февраля 2011

Я работаю над игрой на основе слов.Моя база данных слов содержит около 10000 английских слов (отсортированных по алфавиту).Я планирую иметь 5 уровней сложности в игре.Уровень 1 показывает самые простые слова, а уровень 5 показывает самые сложные слова, условно говоря.

Мне нужно разделить список из 10000 длинных слов на 5 уровней, начиная от самых простых слов до сложных.Я ищу программу, которая сделает это для меня.

Может кто-нибудь сказать мне, если есть алгоритм или метод для количественного измерения сложности английского слова?

У меня есть некоторые мысли, вращающиеся вокруг использования « длина слова » и « частота слова » в качестве факторов, и придумаю формулу или что-то, что достигает этого.

Ответы [ 12 ]

0 голосов
/ 28 февраля 2011

В своей статье об исправлении заклинаний Питер Норвиг использует словарь для подсчета количества вхождений каждого слова (и, следовательно, определения их частоты).

Вы можете использовать это как шагstone:)

Кроме того, частота, вероятно, должна влиять на сложность больше, чем длина ... вам придется провести бета-тестирование игры для этого.

0 голосов
/ 28 февраля 2011

Длина слова - хороший показатель, для частоты слова вам понадобятся данные, поскольку алгоритм, очевидно, не может определить их сам по себе. Вы также можете использовать какую-то оценку, как в игре «Эрудит»: каждая буква имеет значение, а окончательное значение будет суммой значений. Было бы проще найти данные о частоте каждой буквы на вашем языке.

...