Я пытаюсь понять, как сделать что-то в python, что довольно часто встречается в R. При создании pandas
DataFrame очень R
как имена столбцов с точками в них, как Petal.Length
в наборе данных irisобрабатываются довольно хорошо, но Пизи, кажется, умирает от них.Я думаю, это связано с тем, что он пытается интерпретировать его как объекты Python.
Вот пример:
from sklearn import datasets
iris = datasets.load_iris()
iris = pd.DataFrame(data= np.c_[iris['data'], iris['target']],
columns= ["sepal.length","sepal.width","petal.length","petal.width"] + ['species'])
import patsy
y, X = patsy.dmatrices('petal.length ~ sepal.length', iris, return_type='dataframe')
Это дает следующую ошибку:
PatsyError: Error evaluating factor: NameError: name 'sepal' is not defined
petal.length ~ sepal.length
Использование '"petal.length" ~ "sepal.length"'
дает похожую ошибку.Есть ли обходной путь для этого?