У меня есть база данных с 2000 значениями, и она выглядит следующим образом:
Status Job Hours Salary
Permanent Programmer 40 45k
Permanent Analyst 35 50k
Temporary Programmer 35 47k
Permanent Programmer 40 47k
Temporary Technician 35 50k
.
.
.
Я хочу сделать с этой базой разные вещи, не могли бы вы, ребята, помочь мне, пожалуйста?
1 : Мне нужно вычислить, сколько программистов являются постоянными . И рассчитать%. Я использовал этот код, но он не работал (он рассчитывает только первые 200 сотрудников, а не 2000). Кроме того, я не знаю, как использовать результат для вычисления%: (
filter(database, Job == "Programmer" & Status == "Permanent")
2: я считаю, что это проще, но я тоже не понимаю ... Мне нужно вычислить среднее значение (часы) всех аналитиков . Я пробовал это, но это не сработало:
if(Job == "Analyst"){mean(Hours)}
3: мне нужно использовать образец для этого Я знаю это, но это не работает слишком хахаха (трудно начать с R нет? Или это только я?). Мне нужно выбрать 50 сотрудников и повторить этот процесс 1000 раз. Цель - рассчитать доверительный интервал с 90%. Я попробовал это:
x <- 1
if(x != 1000){sample(database, 50)}
Но это не работает ахаха, и для части доверительного интервала я не запустил это.
Из-за классов расстояния, моему учителю трудно помочь нам, поэтому нам нужно найти ответы в одиночку. И вся документация, которую он нам дал, это дистрибутивы (стандартные, пуассоновские, геометрические ...) и графика (поистине, boxplot ...).
Большое спасибо всем вам :) Хорошего дня!