Учитывая формулу модели типа y ~ x
Я хотел бы извлечь все необработанные имена столбцов, которые должны присутствовать во фрейме данных, когда формула используется для подгонки модели.Например, рассмотрим формулу
from patsy import ModelDesc
desc = ModelDesc.from_formula("y ~ x1:x2 + np.log(x3) + I(x4^2)")
Здесь имена столбцов, которые я хотел бы извлечь, будут
['y','x1','x2','x3','x4']
Это эквивалентно тому, что возвращается командой all.vars()
вR.
Соответствующий вопрос можно найти здесь , но в ответе не рассматриваются более сложные термины, такие как np.log(x3)
или I(x4^2)
.