Я обнаружил ошибку в пакете R haven
, когда write_dta
отбрасывает некоторые метки при чтении в Stata. Я подал ошибку в haven
, но мне действительно нужно найти обходной путь, пока ошибка не будет исправлена. Ниже приводится объяснение.
Давайте определим помеченный double только с one tagged NA
value.
library(haven)
#> Warning: package 'haven' was built under R version 3.4.4
tst <-
labelled(
c(
1:5,
tagged_na("d")
),
c(
"Agree Strongly" = 1,
"Agree" = 2,
"Neither agree nor disagree" = 3,
"Disagree" = 4,
"Disagree strongly" = 5,
"No answer" = tagged_na("d")
)
)
tst
#> <Labelled double>
#> [1] 1 2 3 4 5 NA(d)
#>
#> Labels:
#> value label
#> 1 Agree Strongly
#> 2 Agree
#> 3 Neither agree nor disagree
#> 4 Disagree
#> 5 Disagree strongly
#> NA(d) No answer
write_dta(data.frame(freehms = tst), "test.dta", version = 13)
Если я загружу это в Stata и наберу tab freehms
, все метки будут правильными:
Теперь, если я возьму приведенный выше код и добавлю еще одно теговое значение NA
, то write_dta
по какой-то причине отбросит последний ярлык:
library(haven)
#> Warning: package 'haven' was built under R version 3.4.4
tst <-
labelled(c(1:5,
tagged_na('d'),
## Only added this
tagged_na('c')
),
c('Agree Strongly' = 1,
'Agree' = 2,
'Neither agree nor disagree' = 3,
'Disagree' = 4,
'Disagree strongly' = 5,
'No answer' = tagged_na('d'),
## And this
'Dont know' = tagged_na('c')
)
)
tst
#> <Labelled double>
#> [1] 1 2 3 4 5 NA(d) NA(c)
#>
#> Labels:
#> value label
#> 1 Agree Strongly
#> 2 Agree
#> 3 Neither agree nor disagree
#> 4 Disagree
#> 5 Disagree strongly
#> NA(d) No answer
#> NA(c) Dont know
write_dta(data.frame(freehms = tst), "test.dta", version = 13)
Я смотрел на функцию write.dta
из foreign
, но, похоже, она не поддерживает версии Stata после версии 11. Есть ли какая-то другая работа?