добыча последовательности для прогнозирования времени и продукта - PullRequest
6 голосов
/ 08 декабря 2011

Я столкнулся с сложной проблемой, связанной с анализом последовательности, скажем, у меня есть 10 продуктов, у меня есть миллионы записей, каждая из которых содержит пользователя, продукт и временную метку покупки.У каждого пользователя может быть только 1 запись или 100 записей. Например:

user 1, p1, t1
user 1, p1, t2
user 1, p2, t3
user 1, p3, t4
user 1, p1, t5
user 2, p2, t6.....

Теперь мне нужно предсказать, когда будет наилучшее время для продвижения продукта для пользователя.

Пока чтоМое решение состоит в том, чтобы разбить время на несколько категорий.Затем примените Apriori к данным, например, записи будут выглядеть как

user 1, p1T1
user 1, p2T2
user 1, p3T2
user 1, p2T1...

. Тогда я получу правила типа p1T1-> p2T2 и т. Д., Потому что T3> T2> T1 ... любые правила не соответствуют этому условиюбудут отброшены

Однако я не очень доволен этим решением.Есть предложения?

Ответы [ 2 ]

2 голосов
/ 15 декабря 2011

Вместо применения Apriori, вы можете применить алгоритм последовательного интеллектуального анализа (например, PrefixSpan, SPAM, GSP) или алгоритм последовательного интеллектуального анализа правил.

Вы можете проверить мой веб-сайт на наличие исходного кода Java с открытым исходным кодом дляэти алгоритмы и некоторые примеры:

http://www.philippe -fournier-viger.com / spmf /

Надеюсь, это поможет,

0 голосов
/ 12 декабря 2011

Ваша проблема - применение рекомендательной системы, вы можете узнать что-нибудь из KDD cup 2011 .Хотя рекомендуемые предметы - это музыка, но модели также могут удовлетворить ваш запрос.И большинство моделей учитывают время, если вы все еще не удовлетворены, вам нужно кое-что узнать об анализе временных рядов и машинном обучении, чтобы сделать прогноз.

...