Данные семени для американского английского словаря - PullRequest
0 голосов
/ 27 октября 2010

Я хочу найти начальные данные для загрузки в мой словарь.Мне просто нужно орфографическое представление слова (буквы) и определение.

Я ищу один текстовый файл, который содержит эту информацию для анализа и загрузки в мою базу данных.Я использую рельсы, так что если есть гем или плагин, который может это сделать, было бы неплохо, если кто-нибудь об этом знает.

Ответы [ 2 ]

4 голосов
/ 27 октября 2010

Вот, пожалуйста:

http://www.gutenberg.org/ebooks/673

В ней может быть больше информации, чем вам нужно, но вы можете разобрать, что вы хотите. Project Gutenberg преобразует общедоступные (включая просроченные авторские права) книги в текстовую форму.

1 голос
/ 27 октября 2010

Одна из таких известных мне баз данных - WordNet , но это не просто текстовый файл. Вам нужно будет разобрать, что вам нужно, в нужный формат.

Есть и другие. GCIDE - это база данных на основе XML, которая включает в себя не только определения из WordNet, но также некоторые из издания 1913-го года Пересмотренного неисключенного словаря Вебстера (последний теперь общедоступный в США).

...