Применение машинного обучения для рекомендации предметов из существующей базы данных - PullRequest
2 голосов
/ 24 февраля 2012

У меня есть существующая база данных, полная объектов (я буду использовать книги в качестве примера).Когда пользователи заходят на веб-сайт, я бы рекомендовал им книги.

Я могу рекомендовать книги, основанные на других людях, за которыми они следят и т. Д., Но я хотел бы быть более точным, поэтому я собрал наборобучающие данные для каждого пользователя.

Данные собираются путем многократного предоставления каждому пользователю книги и выяснения, нравится ли им ее вид.

Учебные данные хранятся в mongodbкниги хранятся в базе данных postgres.

Я написал код, чтобы предсказать, понравится ли конкретному пользователю данная книга на основе данных об обучении, но мой вопрос таков:

Как применить данные / вероятность к запросу книг в базе данных postgres?

Сохранение вероятности того, что пользователю нравится книга для каждого пользователя, и каждая книга будет неэффективной.

Загрузка всехкниг составляют базу данных, и вычисление вероятности для каждой из них также будет неэффективным.

1 Ответ

0 голосов
/ 24 февраля 2012

Я написал код, чтобы предсказать, понравится ли конкретному пользователю данная книга на основе его обучающих данных

Как выглядит этот код?В идеале это какое-то дерево решений, основанное на атрибутах книги, таких как жанр , длина и т. Д., И технически оно называется классификатором .Простой пример:

if ( user.genres.contains(book.genre) ) {
    if ( user.maxLength < book.length ) {
        print "10% off, today only!"
    } 
}
print "how about some garden tools?"

Сохранение вероятности того, что пользователю нравится книга для каждого пользователя, и каждая книга будет неэффективной.

True.Обратите внимание, что вышеупомянутое дерево решений может быть сформулировано как запрос к базе данных:

SELECT * FROM Books WHERE Genre IN [user.genres] AND Length < [user.maxLength]

, который даст вам все книги, которые с наибольшей вероятностью понравятся пользователю, относительно данных обучения.

...