Как найти столбцы с максимальными оценками - PullRequest
0 голосов
/ 22 января 2020

Эта проблема должна быть решена только в R, а не SQL. У меня проблема с тем, что мне дают указанный ниже набор данных.

Словарь данных

UserID - 4848 клиентов, которые предоставили оценку для каждого mov ie - (Row) Mov ie 1 для Mov ie 206 - 206 фильмов, рейтинги которых предоставлены 4848 разными пользователями (столбцы)

1) Мне нужно найти, какие фильмы имеют максимальное количество просмотров / оценок?

2) Определить топ 5 фильмов с наименьшей аудиторией

Мне удалось получить максимальную оценку за каждый фильм ie (столбец) ниже. Но после этого как ограничить этот результат самым высоким рейтингом ... какой тип фильтра или функции можно использовать.

Я использовал это:

dataset <- read.csv("Amazon - Movies and TV Ratings.csv", row.names = 1)
sapply(dataset,max,na.rm=TRUE)

Это дает мне одну строку с макс. значение для каждого столбца (5,5,2,5,3 et c.)

Пример набора данных:

                Movie1  Movie2  Movie3  Movie4  Movie5  Movie6


   USer1            5      5      NA     NA     NA     NA
   USer2            NA     NA     2      NA     NA     NA
   USer3            NA     NA     NA      5     NA     NA
   USer4            NA     NA     NA      5     NA     NA
   USer5            NA     NA     NA     NA      5     NA
   USer6            NA     NA     NA     NA      2     NA
   USer7            NA     NA     NA     NA      5     NA
   USer8            NA     NA     NA     NA      2     NA
   USer9            NA     NA     NA     NA      5     NA
   USer10           NA     NA     NA     NA      5     NA

Пример снимка экрана: Набор данных рейтинга Amazon

1 Ответ

0 голосов
/ 23 января 2020

Для вашего первого вопроса,

data <-cbind(c(1,5,NA,2,3,5,2,3),c(3,NA,4,1,2,1,3,2),c(NA,1,1,3,4,3))
data <- as.data.frame(data)
colnames(data) <- c("Movie1","Movie2","Movie3")
data

apply(data,2,max,na.rm=TRUE)
#Movie1 Movie2 Movie3 
#5      4      4 

Для второго вопроса, я полагаю - вам нужно указать критерии, по которым вы хотите сказать, что mov ie является лучшим. Пример: что-то вроде того, хотите ли вы сравнить рейтинг со средним рейтингом этого мов ie?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...