Секрет получения hunspell
на работе (по крайней мере, для меня) заключался в том, чтобы выяснить, в каких местах он будет искать, которые принадлежат мне, и поместить туда собственные словари. Также имейте в виду, что словари имеют определенный формат, поэтому вы должны соблюдать эти правила.
Запуск hunspell -D
покажет вам путь поиска. На MacOS мой включает /Users/scott/Library/Spelling
, поэтому я создал этот каталог и поместил туда мой. Допустим, вы хотите назвать свой словарь mydict
, а ваш входной файл данных слов называется dict.txt
. Мы будем использовать путь, который я только что показал.
Сначала скопируйте файл .aff
по умолчанию. Вы увидите это при запуске hunspell -D
, как описано выше. Для меня это в /Library/Spelling/en_US/
. Так
cp /Library/Spelling/en_US.aff /Users/scott/Library/Spelling/mydict.aff
Затем, каждый раз, когда вы обновляете свой список ввода (dict.txt
), делайте это:
DICT=/Users/scott/Library/Spelling/mydict.dic
cd ~/doc/dict
cat dict.txt | sort | uniq > dict.in
wc -l dict.in > $DICT
cat dict.in >> $DICT
rm dict.in
Чтобы запустить hunspell
, просто укажите оба словаря. Так что для меня, потому что я хочу список орфографических ошибок, я использую
hunspell -l -d scott,en_US <filename>