Получить имена столбцов, указанные в формуле - PullRequest
0 голосов
/ 27 сентября 2019

Учитывая формулу модели типа y ~ x Я хотел бы извлечь все необработанные имена столбцов, которые должны присутствовать во фрейме данных, когда формула используется для подгонки модели.Например, рассмотрим формулу

from patsy import ModelDesc
desc = ModelDesc.from_formula("y ~ x1:x2 + np.log(x3) + I(x4^2)")

Здесь имена столбцов, которые я хотел бы извлечь, будут

['y','x1','x2','x3','x4']

Это эквивалентно тому, что возвращается командой all.vars() вR.

Соответствующий вопрос можно найти здесь , но в ответе не рассматриваются более сложные термины, такие как np.log(x3) или I(x4^2).

...