У меня есть это задание:
Участников попросили оценить, сколько минут они проводят в Instagram в день. Результаты этого вопроса находятся в столбце usage_duration. Давайте посмотрим на распределение их ответов. Придумайте для этого подходящую визуализацию и опишите, что вы в ней видите. Включите вертикальную линию, которая показывает среднее использование для всего набора данных.
Вот набор данных (столбец usage_duration):
|usage_duration|
| 54.0 |
| 6576.0 |
| 6.5 |
| 3.5 |
| 346 |
| 456 |
Вот код, который я с помощью, чтобы определить, что задается в вопросе:
mean_of_duration <- mean(as.numeric(SurveyInsta$Usage_duration), na.rm = TRUE)
ggplot(SurveyInsta, mapping=aes(x = Usage_duration)) +
geom_histogram(color="blue", fill="red", color="Average") +
geom_vline(aes(xintercept = mean_of_duration, color="Average"), show.legend = TRUE)
однако я получаю эту ошибку:
Ошибка : StatBin требует непрерывной переменной x : переменная x дискретна. Может быть, вам нужно stat = "count" ?: StatBin требует непрерывной переменной x: переменная x дискретна. Возможно, вам нужно stat = "count"?
Но я я даже не уверен, делаю ли я то, о чем на самом деле просят, поэтому, если вы думаете, что я неправильно понял задание, дайте мне знать.