Изменить обозначение оси в R heatmap - PullRequest
0 голосов
/ 02 апреля 2020

У меня есть тепловая карта, рисующая фрейм данных, который имеет 3 столбца и 100 строк. Оси X и Y представляют координаты X и Y. Когда я создаю карту, она показывает каждое местоположение и становится нечитаемой.

Обе оси находятся в диапазоне 0-100. Я бы хотел, чтобы обе оси были просто go 0,10,20,30,40,50,60,70,80,90,100. Может ли кто-нибудь помочь мне очистить это? Спасибо.

ggplot( data = CombinedDF, mapping = aes( x = factor(allPoints.xLocs), y = factor(allPoints.yLocs) ) ) + 
  geom_tile( aes( fill = sum_patch ),  colour = "white") + labs( x = "X-Coordinate", y = "Y-Coordinate") +
  theme_bw() + theme(axis.text.x = element_text(angle = 45, hjust = 1))


Here is the sample of the input dataframe "CombinedDF"

  allPoints.xLocs allPoints.yLocs sum_patch
1   74.106128071    62.2365805  13
2   70.786698116    58.8928561  13
3   65.543694422    33.8426416  3
4   8.647094783     50.1071865  2
5   95.822909172    11.3294181  4
6   91.324434988    42.4157078  5
7   96.444815141    68.6108005  13
8   13.105758978    83.1488258  7
9   92.958515161    74.3948395  13
10  76.149455458    98.8090307  4

b

Когда я убираю "фактор", я получаю это (ось верна, но нет данных?): enter image description here

Ответы [ 2 ]

1 голос
/ 02 апреля 2020

Ваши данные не полностью полны, чтобы составить тепловую карту. У вас нет единственного значения для каждой комбинации X и Y.

Здесь я воспроизвожу ваш пример, выполнив:

DF <- data.frame(X = runif(100,0,100),
                 Y = runif(100,0,100),
                 sum = sample(0:30,100, replace =TRUE))

Вы можете построить их как точку:

ggplot(DF,aes(x = X, y = Y, color= sum))+
  geom_point()

enter image description here

Еще одна возможность, если вы хотите создать тепловую карту, это создать несколько групповых интервалов (0-10 / 10-20 / ...) , Вы можете сделать это, используя cut функции:

library(dplyr)

DF <- DF %>% mutate(CutX = cut(X,seq(0,100, by = 10)),
              CutY = cut(Y,seq(0,100, by = 10)))

         X          Y sum     CutX    CutY
1 19.48048 79.1970915  17  (10,20] (70,80]
2 42.47574 34.1226793  10  (40,50] (30,40]
3 43.99754 25.7454872   7  (40,50] (20,30]
4 90.88465  0.3961523  18 (90,100]  (0,10]
5 46.26645 38.0338865  25  (40,50] (30,40]
6 93.15978 59.9426569  15 (90,100] (50,60]

Затем вам нужно расширить этот фрейм данных для каждой комбинации X и Y, выполнив:

Expand_DF <- expand.grid(CutX = unique(DF$CutX), CutY = unique(DF$CutY))
Expand_DF$Sum <-NA

      CutX    CutY Sum
1  (10,20] (70,80]  NA
2  (40,50] (70,80]  NA
3 (90,100] (70,80]  NA
4  (30,40] (70,80]  NA
5  (80,90] (70,80]  NA
6  (70,80] (70,80]  NA

Наконец, вы можно связать их вместе, и если несколько значений находятся в одном и том же интервале, вы можете вычислить среднее значение и, наконец, построить их в ggplot, выполнив:

library(dplyr)
library(ggplot2)

DF %>% bind_rows(.,Expand_DF) %>% 
  group_by(CutX, CutY) %>%
  summarise(Sum = mean(sum,na.rm = TRUE)) %>%
  ggplot(aes(x = CutX, y = CutY, fill = Sum))+
  geom_tile(color = "black")+
  scale_fill_gradient(na.value = "white")

enter image description here

Это отвечает на ваш вопрос?

1 голос
/ 02 апреля 2020

Добавьте

scale_x_continuous(n.breaks=10, limits=c(0,100))+

scale_y_continuous(n.breaks=10, limits=c(0,100))

к вашему ggplot.

Подробнее здесь

Добавьте labes=seq(1,100,10) к обеим функциям масштаба, чтобы изменить метку текст от 0 до 100 с шагом 10.

...