Хранение книг в базе данных - PullRequest
5 голосов
/ 16 января 2011

Я хочу создать систему хранения книг (и некоторых других документов).Пользователи смогут войти в систему, где они могут увидеть список всех книг или ввести строку поиска и получить список книг, содержащих строку поиска.Моя проблема в том, что я не знаю, как мне хранить свои книги.Обе книги должны быть доступны для поиска, а поиск должен возвращать идентификатор книги, имя и предпочтительную страницу.Что-нибудь более похожее на текст, содержащийся вокруг поискового запроса, было бы неплохо.

Некоторые факты, которые могут помочь вам получить лучший ответ.

  • База данных не обязательно должна бытьсвободно.Если мне поможет SQL Server или Oracle DB, я за это все.
  • Книг будет около ~ 100 (2-600 страниц)
  • Документов будет около ~ 1000 (10-50 страниц)
  • Добавление книг и документов будетмедленный процесс, который будет происходить редко, поэтому любой тип переиндексации таблиц не должен быть быстрым.
  • Я не решил, как искать документы.Мне нужно, чтобы мои результаты поиска как-то оценивались по релевантности.Это может стать источником другого вопроса в будущем

Ответы [ 3 ]

3 голосов
/ 20 января 2011

Не используйте базу данных RDBMS. СУБД хороши для хранения реляционных данных. Данные, которые вы пытаетесь сохранить, представляют собой набор документов. Используйте хранилище документов, например, couchDB или mongoDB. Однако, поскольку вы должны искать эти данные, лучше проиндексировать эти данные в lucene, который создан для таких нужд

0 голосов
/ 22 декабря 2013

SharePoint Foundation 2010 и 2013 может стать вашим идеальным решением, которое можно использовать абсолютно бесплатно.Вы можете хранить большое количество документов в разных библиотеках документов, добавлять и редактировать их метаданные, а также осуществлять поиск по ним с использованием метаданных, таких как «Название», «Автор» и т. Д., И даже по текстовому содержимому в книге.

0 голосов
/ 20 января 2011

При условии, что вы не собираетесь искать весь текст книги (возможно, рассмотрите возможность первоначальной обработки для хранения сериализованного хэша уникальных слов?):

SQL Server 2008R2 имеет новую систему FILESTREAM, которая будет обеспечивать целостность отношений с использованием механизма БД, но будет поддерживать файлы в файловой системе. Это «лучшее из двух миров», и вам не придется беспокоиться о том, как планы резервного копирования БД влияют на ваши большие двоичные объекты

http://msdn.microsoft.com/en-us/library/cc949109(v=sql.100).aspx

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...