Получение переменных из строк с символами формулы R - PullRequest
0 голосов
/ 10 января 2020

У меня очень простой вопрос. Я хочу иметь возможность разбивать "Income*Educ" или "I(Income^2)")) на строки с соответствующими им переменными, поэтому: "Income" "Educ" и "Income" соответственно. Однако я не знаю, какой это будет тип ..

Следующие исправления: "Income*Educ"

strsplit(gsub("[^[:alnum:] ]", "", str), " +")[[1]]

И этот почти исправляет: "I(Income^2)"))

strsplit(gsub("[^A-Za-z]+", "", str), " +")[[1]]

Как я могу сделать эту функцию для обеих форм?

1 Ответ

1 голос
/ 10 января 2020

Вероятно, лучше избегать регулярных выражений, если вы хотите анализировать R-код. Для этого есть множество встроенных инструментов. Если у вас есть формула типа

ff <- . ~ Income*Educ + I(Income^2)

, вы можете получить все переменные с помощью

all.vars(ff)

. в качестве ответа, но вы можете отфильтровать это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...