Получение кадра данных в правильном формате для кластерного анализа - PullRequest
0 голосов
/ 08 мая 2018

На примере R набор данных:

data("USArrests") при использовании head(USArrests) я получаю следующие результаты:

            Murder Assault UrbanPop Rape
Alabama      13.2     236       58 21.2
Alaska       10.0     263       48 44.5
Arizona       8.1     294       80 31.0
Arkansas      8.8     190       50 19.5
California    9.0     276       91 40.6
Colorado      7.9     204       78 38.7

Когда я использую str(USArrests), появляются следующие результаты:

'data.frame':   50 obs. of  4 variables:
  $ Murder  : num  13.2 10 8.1 8.8 9 7.9 3.3 5.9 15.4 17.4 ...
  $ Assault : int  236 263 294 190 276 204 110 238 335 211 ...
  $ UrbanPop: int  58 48 80 50 91 78 77 72 80 60 ...
  $ Rape    : num  21.2 44.5 31 19.5 40.6 38.7 11.1 15.8 31.9 25.8 ...

Даже если есть другой столбец с другими состояниями (без заголовка столбца). Как получить данные, чтобы первый столбец не отображался при использовании функции str? У меня есть список стран, которые я пытаюсь кластеризовать, но я не могу использовать функцию scale, так как очевидно, что первый столбец не числовой, но я не могу создать новый фрейм данных без этого столбца, так как я пытается кластеризовать страны ...

1 Ответ

0 голосов
/ 08 мая 2018

Похоже, что имена состояний rownames, а не полный столбец. Вы можете преобразовать имена строк в столбец с помощью:

USArrests <- cbind(rownames(USArrests), USArrests)

или преобразовать столбец в имена строк:

rownames(df) <- df$states

Пакет tibble также включает в себя полезные функции: rownames_to_column() и column_to_rownames()

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...