Я ищу некоторые пояснения относительно входных данных для методов объекта base_estimator, как описано в пакете sk-learn RANSACRegressor .В частности, я имею в виду X
и y
, входные данные для методов fit(X,y)
, score(X,y)
и predict(X)
.Описания ниже:
fit(X,y)
: согласовать модель с данными обучения и целевыми значениями. score(X,y)
: возвращает среднюю точность данных испытаний, которые используются длякритерий остановки, определенный stop_score.Кроме того, оценка используется для определения того, какой из двух одинаково больших наборов консенсуса выбран в качестве лучшего. predict(X)
: возвращает прогнозируемые значения с использованием линейной модели, которая используется для вычисления остаточной ошибки с использованием функции потерь.
Документация для RANSAC, реализованная в SciPy Cookbook , немного более проста в своих требованиях к методам, которые должны быть реализованы данным классом модели:
def fit(self, data):
"""Given the data fit the data with your model and return the model (a vector)"""
def get_error(self, data, model):
"""Given a set of data and a model, what is the error of using this model to estimate the data """
Это имеет смысл:
- Функция
fit()
возвращает оценку параметров модели с учетом выборки наблюдаемых точек данных.Размер выборки равен количеству точек данных, необходимых для соответствия модели. - Функция
get_error()
работает как с наблюдаемыми данными, так и с оценкой параметров модели и вычисляет погрешность между наблюдаемыми точками данных ипредсказанные точки данных дают оценку параметров модели.
Из того, что я могу сказать, RANSACRegressor из sk-learn распаковал наблюдаемые SciPy data
в X
и y
, где y = f(X;param_vec)
и f
- это заданное функциональное отношение, возможно, нелинейное.param_vec
- это набор параметров модели, которые должны оцениваться с использованием RANSAC.
Имеет смысл, что fit(X,y)
возвращает оценку параметров модели и является функцией наблюдаемых данных.Для меня не имеет смысла, что predict(X)
является исключительно функцией X
.Для создания набора прогнозируемых точек данных (y_predicted
) также требуется оценка параметров модели param_vec
.
Чего мне не хватает?Я неправильно понял X
и y
?Я хотел бы понять, как param_vec
вписывается в методы класса base_estimator.