У меня есть сотни данных, показывающих массу тела мелких животных разного возраста, полученные из многочисленных исследовательских работ. Я хочу сгруппировать и проанализировать вес по возрасту за периоды 7 дней. Я использовал cut in R успешно, чтобы сгруппировать данные по возрасту и иметь количество значений (количество) по умолчанию в каждом 7d бине. Но даже после большого количества поисков в Google я не могу найти способ расширить «сокращение», чтобы получить базовые статистические сводки для каждого возраста, включающие среднее значение, SE, CL и медиану. Возможно ли это, и может ли кто-нибудь помочь или направить меня в правильном направлении?
Я также посмотрел на dplyr и, хотя, похоже, у него есть возможность предоставлять статистические сводки, я не мог найти способ группировки возрастов. по 7d интервалам. Будет ли это лучшей альтернативой?
Спасибо за любую помощь от непрограммиста.
Спасибо вам обоим за ваши комментарии. Я сожалею, что предоставил ограниченную информацию, я надеюсь, что это проясняет проблему. У меня есть более 2000 строк данных в Excel. Строки - это возраст в днях, столбцы - MaleFI, MaleMEI и MaleBW, где FI - потребление пищи, MEI - потребление метаболизируемой энергии, а BW - масса тела. Часть данных показана ниже. Обычно я могу анализировать данные с помощью сводной таблицы Excel, но она не включает опцию для вычисления медианы или стандартной ошибки; Power Pivot делает, но не группирует! Таким образом, данные являются следующими (отсортированы по возрасту в днях и без пробелов):
Века непрерывны и могут go до 900, с различное количество значений для каждого возраста.
Цель состоит в том, чтобы сгруппировать по 7d периодам, и, как я упоминаю, провести статистический анализ по каждой группе таким образом:
Это код, который я использовал для группировки данных, но, как я уже говорил, задним числом, вероятно, использование dplyr с group_by и обобщение может быть лучшим подходом.
Выход составляет (21,28] (28,35] (35,42] (42,49] (49,56] (56,63] (63,70] (70, 77]
6 15 41 73 92 98 95 99
Я был бы доволен форматом диапазонов, т.е. (21,28] и c, а не 21-28.
Спасибо за ваши комментарии, и я извиняюсь за то, что не уточнил требование. Я очень благодарен вам за то, что вы уделили время на помощь.
dput (head (Pivot.data, 20)) структура (список (Age = c (28, 28, 28, 28, 28, 28, 30, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35, 35), MaleFI = c (14,62, 13,82, 10,6691449814126, 15,9859154929577, 11,7, 14,0273778252258, 13,5877862595419, 17,73, 17,93, 17,99, 22,12142857.7286, 17,6, 19,1, 21,6,6,6,6, 17,6, 21,6, 21,6, 21,6, 17,6, 17,6, 17,6, 21,6, 21,6, 21,6, 17,6, 21,6, 21,6, 21,6, 17,6, 21,6, 21,6, 21,6, 17,6, 21,6, 21,6, 21,6, 17,6, 21,6, 21,6, 21,6, 17,6, 21,6, 21,6, 21,6, 17,6, 21,6, 21,6, 21,6, 17,6, 21,6, 21,6, 21,6, 17,6, 21,6, 21,6, 21,6, 17,6, 17,6, 17,6, 17,6, 17,6, 21,6, 17, 21, 21, 21 , 21.4, 21.25, 20.37, +19,3215613382899, 23,169014084507), MaleMEI = c (212,66252, 201,02572, +144,342862453531, +216,273450704225, +160,171462269, +204,047711328562, 197,653240885495, 257,90058, 241,76812, 261,68254, 298,285342857143, 238,3216, 304,40168, 315,6482, 285,1016, 311,2844, 309,1025, 296,30202, 261,401403345724, 313,453591549295), MaleBW = c (121,68, 112,15, 85,7142857142856, 143,181818181818,9,12, 129, 222, 221, 225, 221, 225, 221, 221, 221, 221, 221, 221, 221, 221, 221, 221, 2, 2, 2, 2, 31, 2, 5, 31, 12, 25, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 2, 3, 3, 3, 3, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 5, 3, 2, 3, 3, 3, 3, 2, 3, 2, 3, 3, 3 - 5, т. , 132,4, 191,21, 179,44, 138,095238095238, 202,272727272727)), row.names = c (NA, 20L), class = "data.frame")