Какая база данных лучше всего подходит для хранения данных тегов и контента? - PullRequest
0 голосов
/ 19 мая 2011

У меня есть система, которая содержит капли контента и очень длинный список тегов (более 4000), контент анализируется отдельным приложением, затем извлекается частота и местоположение каждого тега, какая система баз данных лучше всего подходит дляхранить огромное количество контента и тегов, которые затем позволят осуществлять поиск по таким тегам?

1 Ответ

1 голос
/ 19 мая 2011

Я бы взглянул на Lucene (и связанные с ним проекты, такие как Solr и ElasticSearch) или Sphinx, то есть на поисковые системы текста, а не на то, что вы обычно называете базой данных.

Эти механизмы предназначены для индексации документов - больших двоичных объектов текста, разбивая их на множество мелких компонентов («токенизация»). Проблема, которую вы описываете - хранение большого двоичного объекта и длинного списка тегов - находится в этом домене.

...