Использование дерева решений для создания приложения рекомендаций - PullRequest
1 голос
/ 02 марта 2020

Прежде всего, мои извинения, если я не следую некоторым из лучших практик этого сайта, как вы увидите, мой дом в основном MSE (обмен математическим стеком).

В настоящее время я работаю над проект, в котором я строю систему рекомендаций для отпуска. Первоначальная идея была несколько схожа с 20 вопросами: мы задаем пользователю определенные вопросы, такие как «Нравится ли вам музеи?», «Нравится ли вам архитектура», «Нравится ли вам ночная жизнь» и т. Д. 1014 *., А затем на основе эти ответы решают для пользователя их лучшее место отдыха. Мы отвечаем на эти вопросы на основе ключевых слов, вырезанных с веб-сайтов, и дерево решений, которое мы внедрили бы, позволило бы нам эффективно определить следующий вопрос, который нужно задать пользователю. Однако у нас возникли некоторые трудности с реализацией. Вот некоторые примеры наших трудностей:

Есть проблемы с детализацией вопросов. Например, сказать, что город хорош для "любителей природы" - это здорово, но это мало что значит. Природа может включать, скажем, жаркий, солнечный и влажный отдых для некоторых, тогда как для других природа может включать в себя оживленный поход в прохладные леса. К счастью, API, который мы используем в настоящее время, предоставляет нам список достопримечательностей города, вплоть до достаточно детального уровня (например, он различает различные виды водного спорта, такие как катание на водных лыжах или рафтинг). Мой вопрос: нужно ли нам создавать какие-то высокотехнологичные структуры, такие как:

  • nature-> (Ocean, Mountain, Plains) (Mountain-> Hiking, Skiing, ...)

или было бы лучше просто включить результаты нижнего уровня (сами мероприятия) и просто задать вопросы относительно них? Я спрашиваю только потому, что не знаю точно, как проводится классификация и производится окончательный результат. Есть ли лучшая структура, которую следует использовать?

Большое спасибо за помощь.

Ответы [ 2 ]

0 голосов
/ 04 марта 2020

Бункеры и суббункеры - это хорошая идея, как и природа, характер Ocean_nature.

Я размышлял о вашей проблеме вчера вечером, было бы хорошей идеей TripAdvisor. Что я хотел бы сделать, так это взять 10 лучших пунктов в Trip Advisor и распределить их по типам.

Или, может быть, ваше дерево сузит его до 10 городов. Вы могли бы ранжировать эти города в соответствии с популярностью или расстоянием от пользователя.

Я не уверен, как решить, какой город лучше всего подходит для водных видов спорта и т. Д. c. Вы могли бы даже заплатить городам, чтобы быть на вершине списка.

0 голосов
/ 02 марта 2020

Я думаю, что использование дерева решений - отличная идея для этой проблемы. Это может быть идея сгруппировать ваши гранулированные действия, и для категории "любителей природы" перечислить ряд различных типов климата: Dry и солнечный, прибрежный, лесной и т. Д. c и иметь подкатегории в них.

Для занятий можно составить категорию под названием водный спорт, экскурсии и т. Д. c. Похоже, ваш набор данных более детализирован, чем вы хотите, чтобы ваше дерево решений было, но вы можете просто продолжать делить эту гранулярность на несколько категорий в дереве, пока не достигнете уровня, который вас устраивает. Это может быть идея включить изображения также, каждого места и деятельности. Возможно даже без описательного текста.

...