Question

У меня есть система, которая содержит капли контента и очень длинный список тегов (более 4000), контент анализируется отдельным приложением, затем извлекается частота и местоположение каждого тега, какая система баз данных лучше всего подходит дляхранить огромное количество контента и тегов, которые затем позволят осуществлять поиск по таким тегам?

Elad · Answer 1 · 19 мая 2011

Я бы взглянул на Lucene (и связанные с ним проекты, такие как Solr и ElasticSearch) или Sphinx, то есть на поисковые системы текста, а не на то, что вы обычно называете базой данных.

Эти механизмы предназначены для индексации документов - больших двоичных объектов текста, разбивая их на множество мелких компонентов («токенизация»). Проблема, которую вы описываете - хранение большого двоичного объекта и длинного списка тегов - находится в этом домене.

Какая база данных лучше всего подходит для хранения данных тегов и контента?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Какая база данных лучше всего подходит для хранения данных тегов и контента?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы