MapReduce и имел oop правильную логику - PullRequest
0 голосов
/ 01 апреля 2020

я изучаю BigData, и мне нужно решить проблему. На самом деле у меня есть файл со всеми рецензиями amazon, сделанными пользователями в категории игр со star_rating, user_id и review_body. Я должен использовать MapReduce и показывать слова, имеющие 0,5 очка. Таким образом, для каждого класса рейтинга (star_rating), если слово используется в обзоре несколько раз, рассмотрите его только один раз (= не учитывайте повторения слов). Средний для всех пользователей, даже если они не использовали слово. В результатах отображаются только слова, среднее число вхождений которых больше или равно 0,5

. Я думал использовать слово ad key и (start_rating, user_id) в качестве значения после Mapper, я сделал несколько попыток в java но не могу решить. Является ли мой лог c правильным или мне нужно использовать новый лог c для MapReduce?

...