У меня исключительно большой набор данных (50+ сайтов, 100+ растворенных веществ), и я хотел бы быстро создать сводную таблицу описательной статистики для данных и иметь возможность экспортировать ее в виде файла .csv.
Пример кода (очень небольшое подмножество моих данных):
Site <- c( "SC2", "SC2" , "SC2", "SC3" , "SC3" ,"SC3", "SC4", "SC4" ,"SC4","SC4","SC4")
Aluminum <- as.numeric(c(0.0565, 0.0668 ,0.0785,0.0292,0.0576,0.075,0.029,0.088,0.076,0.007,0.107))
Antimony <- as.numeric(c(0.0000578, 0.0000698, 0.0000215,0.000025,0.0000389,0.0000785,0.0000954,0.00005447,0.00007843,0.000025,0.0000124))
stats_data <- data.frame(Site, Aluminum, Antimony, stringsAsFactors=FALSE)
stats_data_gather =stats_data %>% gather(Solute, value, -Site)
table_test = stats_data_gather %>%
group_by(Site, Solute) %>%
get_summary_stats(value, show = c("mean", "sd", "min", "q1", "median", "q3", "max"))
Это приводит к кадру данных, который вычисляет требуемую статистику, НО, результаты усекаются только до трех знаков после запятой (то есть, что должно быть что-то вроде 0,00000057 отображается как 0,000).
Я пробовал варианты использования:
options(digits = XX),
format(DF, format = "e", digits = 2),
format.data.frame(table_test, digits = 8)
Я пробовал этот и другой пример кода, найденный в Интернете, но ни один не будет воспроизводить итоговый кадр данных, который включает в себя все необходимые нули для небольшое число результатов (т. е. 0,00000057, а не 0,000). Я бы даже согласился с нотацией scientifi c, но мне не удалось найти пример, который будет работать.
Это мой первый пост. Я надеюсь, что предоставил достаточно деталей для помощи! Спасибо!