Большой текстовый файл словарь случайных слов для сравнительного анализа? - PullRequest
4 голосов
/ 24 октября 2010

Мне было интересно, может ли кто-нибудь указать мне очень большой словарь случайных слов, который можно было бы использовать для проверки некоторых высокопроизводительных строковых структур данных?Я нахожу некоторые, которые находятся в диапазоне ~ 2 МБ ... однако я хотел бы немного больше, если это возможно.Я предполагаю, что где-то должен быть какой-то большой стандартный набор строковых данных, который можно было бы использовать.Спасибо!

Ответы [ 2 ]

4 голосов
/ 24 октября 2010

http://norvig.com/big.txt

Ссылка выше была упомянута в статье проверки орфографии Norvig - http://norvig.com/spell-correct.html

1 голос
/ 25 октября 2010

Я бы порекомендовал взглянуть на материал, доступный на TREC (Text REtrieval Conference). Несколько хороших наборов данных, которые могут соответствовать вашим требованиям.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...