Apache Mahout Vs Apache Искра в локальном режиме с данными о гайке - PullRequest
0 голосов
/ 08 апреля 2020

У меня уже есть приложение NUTCH / SOLR в одиночном режиме. Я супруга, чтобы попытаться интегрировать Mahout или Spark, чтобы добиться своего рода персонализированных результатов. Но я все еще очень далек от этого момента.

При недостатке знаний, времени и ресурсов есть быстрый и эффективный способ использовать один инструмент с индексированными данными Nutch crawled.db или solr для представления персонализации в качестве доказательства концепции?

Я открыт для любой идеи.

С уважением

1 Ответ

0 голосов
/ 08 апреля 2020

Учитывая, что вы говорите Spark vs Mahout - я думаю, что вы думаете о "старом" Mahout, основанном на MR, который устарел и перешел на "поддержку сообщества".

Я бы порекомендовал вам использовать Mahout Samsara, которая является библиотекой Spark. Например, мой ответ: вы должны использовать Mahout и Spark. Для локального режима вы можете использовать Mahout Векторы / Матрицы.

Вопрос неопределенный, но, основываясь на тегах, я думаю, что этот учебник может быть хорошим местом для начала, так как он использует Mahout и Solr для механизма рекомендаций.

http://mahout.apache.org/docs/latest/tutorials/cco-lastfm/

Отказ от ответственности: я PM C проекта Apache Mahout.

...