Я выбираю количество выборок из большого кадра данных, затем присваиваю этим выборкам номер в зависимости от того, когда они были собраны. Затем я строю график с помощью ggplot (это не проблема!).
Проблема, с которой я столкнулся, заключается в том, что в некоторых из этих образцов отсутствуют строки, поэтому у меня нет записи для всех 8 "ref_name" ни в одном из образцов. Есть ли способ, которым я могу добавить 0 к «rpkm», если другой образец имеет значение для этого конкретного «ref_name»? Или способ объединить выбранные образцы, которые показали бы это и позволили бы мне построить график?
- выберите образцы из "данных", затем соберите образцы 2-4 в том же
sample_1<- data %>%
filter(samp_id %in% "23") %>%
select(samp_id, ref_name, rpkm) %>%
mutate(samp_no="1")
- присоединиться к четверке, чтобы построить
plot <- bind_rows(sample_1, sample_2, sample_3, sample_4)
ggplot()+
geom_col(data=plot, aes(x=samp_no, y=rpkm, fill=ref_name), position="dodge"))
На полученном графике я вижу столбцы, где значение rpkm имело значение, но поскольку во входных данных не отображается 0s в rpkm, я не вижу пробела, показывающего rpkm = 0, который я хочу видеть.
результирующий участок
первые 10 строк данных графика