Структура файла словаря открытых орфографических проверок - PullRequest
7 голосов
/ 25 октября 2011

Существуют ли какие-либо документы или руководства по структуре файловых словарей FreeDict, Aspell, Hunspell / OpenOffice, особенно касающиеся переключателей в конце каждой строки в каждом файле .dic?Я предполагаю, что переключатели описывают семантическую интерпретацию слова, будь то

  • существительное
  • прилагательное
  • наречие
  • наречие
  • и т. Д.

или любой комбинации вышеперечисленного.Но я не знаю, как сопоставить их с символами переключения.

Мне также интересно, что описывает файл .aff.

Ответы [ 3 ]

1 голос
/ 26 мая 2012

Просто пара ссылок, которые могут вам помочь:

это на sthackoverflow: Какой формат словарей OpenOffice?

эта вторая хорошаяначало

http://sourceforge.net/apps/mediawiki/freedict/index.php?title=Main_Page

надеюсь, это поможет

1 голос
/ 25 мая 2012

Это выглядит как хорошая отправная точка, и загрузки на этой странице могут иметь документацию формата, которую вы ищете.

0 голосов
/ 01 декабря 2013

В Hunspell выбранные вами теги являются произвольными, они не имеют никакого значения, кроме того, которое вы им назначаете. Вы можете выбрать из использования букв, цифр (1-65535) и др.

Файл аффиксов описывает многие вещи, но в основном касается того, как слова переносятся.

Например:

$ test.dic
4
apple/a
banana/a
green/b
small/b

$ test.aff
SFX a Y 2 # Allow the following 2 suffixes to words with the "a" flag.
SFX a 0 s . # An "s" at the end for words ending in any letter (signified by the dot). "Apples" and "bananas". 
SFX a 0 s' . # "Apples'" and "bananas'".

SFX b Y 2
SFX b 0 er . # "Greener" and "smaller".
SFX b 0 est . # "Greenest" and "smallest".

В руководстве подробно объясняется большинство вещей. Есть также тестовые файлы, которые можно посмотреть.

...