Как создать файлы аффикса и di c для текстового поиска postgresql - PullRequest
0 голосов
/ 31 марта 2020

Я хочу использовать возможность текстового поиска postgresql для одного из моих проектов. Поддерживаемый язык будет английским sh и индонезийским. К сожалению, я не могу найти индонезийский конфиг для использования. (пример здесь https://www.cs.hmc.edu/~geoff/ispell-dictionaries.html)

Глядя на https://www.postgresql.org/docs/11/textsearch-dictionaries.html, кажется, я могу сделать свои собственные пользовательские стоп-слова, аффиксы и файлы di c , Я уже нашел и загрузил файл стоп-слов (из https://github.com/masdevid/ID-Stopwords), в то время как для аффикса (правило выглядит как здесь http://indodic.com/affixeng.html), я не могу найти файл или способ написания файла affix / di c.

Может ли кто-нибудь указать мне, как, или, возможно, где я могу найти некоторую информацию более подробно?

1 Ответ

0 голосов
/ 31 марта 2020

Ссылка Ispell , на которую есть ссылка в документации PostgreSQL, содержит следующую информацию:

Полная документация для ispell, включая документацию формата аффикс-файла, поставляется с дистрибутив в формате Unix. Если на вашем компьютере установлен ispell, вы можете набрать "man ispell", чтобы просмотреть его. Для удобства и просмотра веб-страница первичного руководства для ispell также доступна в Интернете.

Вам придется изучить это, а затем создать файл аффикса.

...