Самый дешевый способ индексировать большой набор данных в linux (желательно с sphinx) - PullRequest
0 голосов
/ 26 марта 2012

У меня есть база данных с 150 миллионами продуктов, я хотел бы проиндексировать их с помощью sphinx, но иметь только ~ 2 ГБ ОЗУ, есть ли реальный способ индексировать все эти данные с использованием sphinx, но при этом оставаясь ниже 2 ГБ?

Мне нужно только индексировать название продукта, описание продукта и марку.Хотя у меня есть несколько атрибутов, но они не должны быть доступны для поиска.

Ответы [ 2 ]

1 голос
/ 26 марта 2012

Изменение ondisk_dict http://sphinxsearch.com/docs/current.html#conf-ondisk-dict

Таким образом загружается только небольшой объем данных. Сфинксу вообще не нужно много памяти.

Поскольку вы используете атрибуты, docinfo, может использоваться для управления ими http://sphinxsearch.com/docs/current.html#conf-docinfo

Также уменьшение max_matches с помощью функции setLimit также должно уменьшить использование памяти во время выполнения.

0 голосов
/ 26 марта 2012
...