Новое для R (для биостатов) здесь! У меня огромный набор данных, и я использую describe()
и describeBy()
из пакета психологии. Но я также пытаюсь найти способ сделать базовую c статистику для подгрупп в подгруппах.
Например, мой набор данных о членстве в клубе, в котором есть китайцы и индийцы. Другие переменные включают пол, возраст, рост, вес, ИМТ и так далее.
Я выяснил psych::describeBy
, чтобы посмотреть на средние значения и стандартное отклонение для подгрупп, определяемых одной переменной, например, этнической принадлежностью, но я не могу выясните, как сузить это, чтобы я генерировал сводку только для китайских мужской членов.
Я попытался переопределить с помощью функции subset()
, а затем снова запустить describeBy
, например,
chinese <- subset(maindata, chinese=1)
describeBy(chinese, male=1)
Но это не сработало, и результаты были такими же, как у describeBy(maindata,chinese=1)
, а не у китайского мужского подмножества.
Я надеюсь, что имеет смысл.
Единственное другое решение, которое я могу придумать, - это разбить мой основной набор данных на более мелкие в MS Excel и повторно загрузить каждый из них отдельно (например, Chinese.xls, Indian.xls) или создать новая переменная с определением сочетания этнической принадлежности и пола, например, Chinesemale = 1, Chinesefemale = 2, Indianmale = 3, Indianfemale = 4.
Мне более или менее потребуется проанализировать по этим подгруппам подгрупп для t -проверяет d Фишер точен, поэтому любые хорошие рекомендации по пакетам, которые помогут решить эти проблемы, будут оценены!