Формат файла OpenOffice / Mozilla * .dic - PullRequest
2 голосов
/ 29 декабря 2010

Я бы хотел использовать словарь openoffice / mozilla по своему усмотрению.Я попытался найти документацию по формату файлов формата dic (кажется, это легко), но у меня проблема с этим.Если у кого-то есть такая документация, я буду благодарен за информацию

Ответы [ 2 ]

6 голосов
/ 18 октября 2012

В начале был MySpell, а затем была версия UTF-8, Hunspell ...

Короче говоря, в основном есть два файла: * .dic и * .aff.

Первый содержит список правильных слов. Второй имеет аффиксов .

Я нашел ссылку , которая объясняет это.

0 голосов
/ 29 декабря 2010

Согласно моему первому результату в Google это обычный текстовый файл (в кодировке UTF-8), в котором все слова перечислены в алфавитном порядке в отдельных строках (\r\n конец строки), начиная со строки2. В строке 1 содержится количество слов.

Краткий просмотр случайного файла .dic подтверждает это.Не должно быть слишком сложно найти такие вещи.

...