Предположим, у меня есть фрейм данных со столбцом для значений и другим столбцом для числа раз, когда это значение наблюдалось:
x <- data.frame(value=c(1,2,3), count=c(4,2,1))
x
# value count
# 1 1 4
# 2 2 2
# 3 3 1
Я знаю, что могу получить средневзвешенное значение данных, используя weighted.mean
и взвешенную медиану с использованием функции weighted.median
, предоставляемой несколькими пакетами (например, limma
), но как я могу получить другие взвешенные статистические данные по моим данным, такие как 1-й и 3-й квартили и, возможно, стандартное отклонение?«Расширение» данных с использованием rep
не вариант, потому что sum(x$count)
составляет около 3 миллиардов (размер человеческого генома).