В R как подсчитать количество вхождений для указанного столбца c? - PullRequest
0 голосов
/ 17 января 2020

Я импортировал набор данных SAS в RStudio. Я хочу посмотреть на указанный столбец c, называемый "пол" (1 = женщина, 2 = мужчина), а затем посчитать число 1 и 2 соответственно, но я получаю следующее сообщение об ошибке:

Сообщение об ошибке

> colnames(bios)
  [1] "PUF_CASE_ID"                 "PUF_FACILITY_ID"            
  [3] "FACILITY_TYPE_CD"            "FACILITY_LOCATION_CD"       
  [5] "AGE"                         "SEX"                        
  [7] "RACE"                        "SPANISH_HISPANIC_ORIGIN"    



  PUF_CASE_ID PUF_FACILITY_ID FACILITY_TYPE_CD FACILITY_LOCATI…   AGE   SEX  RACE
   <chr>       <chr>                      <dbl>            <dbl> <dbl> <dbl> <dbl>
 1 Db309d6d8-… OGMJIMFFRC                     2                1    82     2     1
 2 D39a0df19-… OGMJIMFFRC                     2                1    68     1     1
 3 D40032d28-… OGMJIMFFRC                     2                1    76     1     1
 4 D2dac989c-… OGMJIMFFRC                     2                1    82     1     1
 5 Db0ba85a6-… OGMJIMFFRC                     2                1    64     1     1
 6 D9448c7ff-… OGMJIMFFRC                     2                1    55     1     1
 7 Daa3e4e44-… OGMJIMFFRC                     2                1    50     2     1
 8 D5f0e487d-… OGMJIMFFRC                     2                1    58     2     3
 9 D353b0fac-… OGMJIMFFRC                     2                1    80     1     1
10 D1d1761fb-… OGMJIMFFRC                     2                1    71     1     1

Я абсолютный новичок в R и не уверен, что пошло не так. Я могу просмотреть свой набор данных, и я определенно не пишу имена столбцов неправильно.

Буду признателен за любую помощь!

Ответы [ 2 ]

2 голосов
/ 17 января 2020

Ваши имена столбцов в верхнем регистре. Это должно работать в формате R

table(bios[,'SEX'])

Если вы заинтересованы в подходе dplyr, сделайте это

library(tidyverse)
bios%>%select(SEX)

To посчитайте количество единиц и 2, сделайте это

bios%>%count(SEX)
1 голос
/ 17 января 2020

Без необходимости устанавливать какие-либо пакеты, в базе R вы можете просто:

summary(as.factor(bios$SEX))

или с помощью функции table:

table(as.factor(bios$SEX))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...