База данных для поисковой системы - PullRequest
1 голос
/ 12 августа 2010

Я думаю о разработке поисковой системы, но понятия не имею о бэкэнде, который я мог бы использовать эффективно. Пожалуйста, предложите мне базу данных, в которой я могу хранить тысячи записей и запрашивать их в кратчайшие сроки. Я разрабатываю поисковую систему для своих собственных интересов, поэтому, пожалуйста, не дайте мне никаких критических мыслей, которые обычно встречаются в подобных вопросах.

Thankyou

Ответы [ 3 ]

2 голосов
/ 29 октября 2010

Взгляните на Cloudant , который представляет собой кластеризованное / масштабируемое развертывание Apache CouchDB . CouchDB является частью инициативы NoSQL (она использует файловую систему вместо отвлечения хранилища на сервере базы данных), и ей говорят, что она достаточно хорошо масштабируется, особенно в Cloudant, хотя я сам не пробовал.

Очевидно, что с любой DODB (базой данных, ориентированной на документы, как выражается Apache) вам придется перенести свои проблемы не только на индексирование памяти и таблиц, чтобы включить емкость хранения, хотя использование файловой системы означает, что вы в целом можете используйте меньше памяти (так как меньше информации хранится в памяти). Это общее обобщение, но вы поняли.

1 голос
/ 25 августа 2012

MySQL и Полнотекстовые индексы являются хорошим решением для поиска в тысячах записей. Когда вы увеличиваете масштаб и приближаетесь к 1 миллиону строк, Полный текст MySQL становится медленным, и вам придется использовать другой подход, например Sphinx .

1 голос
/ 12 августа 2010

Для тысяч записей достаточно стандартного rdbms.На протяжении сотен миллионов и более вы, возможно, захотите поискать альтернативы.

Но поскольку вы делаете это в своих собственных интересах, сделайте одно с каждым, чтобы понять различия.

...