Прежде всего, мои извинения, если я не следую некоторым из лучших практик этого сайта, как вы увидите, мой дом в основном MSE (обмен математическим стеком).
В настоящее время я работаю над проект, в котором я строю систему рекомендаций для отпуска. Первоначальная идея была несколько схожа с 20 вопросами: мы задаем пользователю определенные вопросы, такие как «Нравится ли вам музеи?», «Нравится ли вам архитектура», «Нравится ли вам ночная жизнь» и т. Д. 1014 *., А затем на основе эти ответы решают для пользователя их лучшее место отдыха. Мы отвечаем на эти вопросы на основе ключевых слов, вырезанных с веб-сайтов, и дерево решений, которое мы внедрили бы, позволило бы нам эффективно определить следующий вопрос, который нужно задать пользователю. Однако у нас возникли некоторые трудности с реализацией. Вот некоторые примеры наших трудностей:
Есть проблемы с детализацией вопросов. Например, сказать, что город хорош для "любителей природы" - это здорово, но это мало что значит. Природа может включать, скажем, жаркий, солнечный и влажный отдых для некоторых, тогда как для других природа может включать в себя оживленный поход в прохладные леса. К счастью, API, который мы используем в настоящее время, предоставляет нам список достопримечательностей города, вплоть до достаточно детального уровня (например, он различает различные виды водного спорта, такие как катание на водных лыжах или рафтинг). Мой вопрос: нужно ли нам создавать какие-то высокотехнологичные структуры, такие как:
- nature-> (Ocean, Mountain, Plains) (Mountain-> Hiking, Skiing, ...)
или было бы лучше просто включить результаты нижнего уровня (сами мероприятия) и просто задать вопросы относительно них? Я спрашиваю только потому, что не знаю точно, как проводится классификация и производится окончательный результат. Есть ли лучшая структура, которую следует использовать?
Большое спасибо за помощь.