Не очень уверен в вашем вопросе, так как никогда не использовал Stata. Самый важный шаг - это факторинговая часть. По умолчанию уровни отсортированы по алфавиту.
df = data.frame(y = runif(100, 0, 10000), x = rep(c("I strongly agree", "I agree", "I disagree", "I strongly disagree"), 25))
levels(df$x)
[1] "I agree" "I disagree" "I strongly agree"
[4] "I strongly disagree"
На всякий случай, я предполагаю, вы имеете в виду определение одинаковых уровней для каждого набора данных. Итак, вы можете сделать:
lvls = c("I strongly agree", "I agree", "I disagree", "I strongly disagree")
df$x = factor(df$x,levels=lvl)
levels(df$x)
[1] "I strongly agree" "I agree" "I disagree"
[4] "I strongly disagree"
Итак, для таблицы может быть что-то вроде:
data.frame(num = 1:length(lvl),lvl)
num lvl
1 1 I strongly agree
2 2 I agree
3 3 I disagree
4 4 I strongly disagree
И вы можете подмножество, используя:
df[df$x==lvl[1],]
Или:
df[df$x==levels(df$x)[1],]