Postgresql Полнотекстовый поиск чисел с предшествующим hashsign - PullRequest
0 голосов
/ 05 февраля 2020

Документы, для которых я хочу запустить полнотекстовый поиск, содержат последовательности знака ha sh, за которым следует ряд цифр, например # 12345 # 9999. Ни один из синтаксических анализаторов, кажется, не распознает последовательность как один токен.

Пустой синтаксический анализатор распознает '#' как токен, поэтому я подумал, что мог бы использовать словарь синонимов, чтобы сопоставить '#' с 'num' и затем используйте следующий оператор, например # <-> 1234. Однако; пустой синтаксический анализатор группирует все пустые символы в один токен, поэтому токен обычно содержит начальный пробел '#'. Я не могу сделать запись синонима с начальным пробелом (или, по крайней мере, не знаю, как это сделать).

Если я включил словарь english_stem в отображение пустого парсера, то '#' распознается как лексема. Но так же, как и все другие пустые символы, которые добавляют слишком много шума к сгенерированному ts_vector

Если не считать создания собственного синтаксического анализатора, так или иначе, я могу настроить поиск так, чтобы я мог использовать полнотекстовый поиск, чтобы явно запрашивать # 0000 моделей?

...