R отображает числа уровней факторов, имеющих n, n + 1, .... count - PullRequest
1 голос
/ 01 апреля 2020

У меня очень большой набор данных (> 200000 строк) с 6 переменными (показаны только первые две)

>head(gt7)
      ChromKey  POS
    1     2447   25
    2     2447  183
    3    26341   75
    4    26341 2213
    5    26341 2617
    6    54011 1868

Я преобразовал переменную Chromkey в факторную переменную, состоящую из> 55000 уровней.

> gt7[1] <- lapply(gt7[1], factor)
> is.factor(gt7$ChromKey)
[1] TRUE

Далее я могу создать таблицу с количеством уровней ChromKey

> table(gt7$ChromKey)

   1    2    3    4    5    6    7    8    9   10   11   12   13   14   15   16   17 
  88   88   44   33   11   11   33   22  121   11   22   11   11   11   22   11   33 
  18   19   20   21   22   23   24   25   26   27   28   29   30   31   32   33   34 
  22   22   44   55   22   11   22   66   11   11   11   22   11   11   11  187   77 
  35   36   37   38   39   40   41   42   43   44   45   46   47   48   49   50   51 
  77   11   44   11   11   11   11   11   11   22   66   11   22   11   44   22   22 
... outut cropped

, которую я могу сохранить в формате таблицы

> table <- table(gt7$ChromKey)
> head(table)

 1  2  3  4  5  6 
88 88 44 33 11 11  

Я хотел бы знать возможно ли иметь таблицу (и гистограмму) из числа уровней с указанными c числами. Из приведенного выше примера я бы ожидал

  88  44  33  11
   2   1   1   2                   

Я был бы очень признателен за любую подсказку.

1 Ответ

0 голосов
/ 01 апреля 2020

Мы можем применить table снова на выходе, чтобы получить частотный счетчик частоты

table(table(gt7$ChromKey))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...