Считать метки значений Stata из отдельного файла в R - PullRequest
0 голосов
/ 31 мая 2018

У меня есть набор данных Stata (файл .dta), который содержит одну переменную, RGA (это MWE, у меня фактически есть тонны переменных).Эта переменная принимает 3 факторных значения: 1, 2 и 3. Эти факторы относятся к значимым вещам (так называемые «метки значений»), а связь между факторами и их метками значений находится в отдельном .txt Stata-подобном файле, полностьювоспроизведено здесь:

    . label define RGA_l
        1 "meaning of 1"
        2 "meaning of 2"
        3 "meaning of 3"

    . label values RGA RGA_l

Я загружаю свой файл .dta в R через пакет haven.Я хотел бы иметь легкий доступ к меткам значений RGA в R, в частности, чтобы иметь возможность быстро сопоставлять значения RGA с их метками значений для получения удобочитаемого вывода.Как я могу прочитать этот отдельный файл .txt в R таким образом, чтобы я мог сопоставить его с моим набором данных?

1 Ответ

0 голосов
/ 31 мая 2018

Я не знаю точно, какой тип столбца haven импортирован (попробуйте использовать str() на вашем фрейме данных), но вот как вы создаете факторы в R. Функция factor несколько сбивает с толку, потому что факторы не делаютна самом деле есть метки как таковые, они имеют только уровни, но аргумент по-прежнему называется labels.

set.seed(100)
df <- data.frame(RGA_1 = sample.int(3, 10, replace = TRUE))

df$RGA_1 <- factor(df$RGA_1, labels = c("meaning1", "meaning2", "meaning3"))
df
#>       RGA_1
#> 1  meaning1
#> 2  meaning1
#> 3  meaning2
#> 4  meaning1
#> 5  meaning2
#> 6  meaning2
#> 7  meaning3
#> 8  meaning2
#> 9  meaning2
#> 10 meaning1

.2.0).

...