sk-learn RANSAC Регрессор base_estimator Метод Входные данные - PullRequest
0 голосов
/ 30 апреля 2019

Я ищу некоторые пояснения относительно входных данных для методов объекта base_estimator, как описано в пакете sk-learn RANSACRegressor .В частности, я имею в виду X и y, входные данные для методов fit(X,y), score(X,y) и predict(X).Описания ниже:

  1. fit(X,y): согласовать модель с данными обучения и целевыми значениями.
  2. score(X,y): возвращает среднюю точность данных испытаний, которые используются длякритерий остановки, определенный stop_score.Кроме того, оценка используется для определения того, какой из двух одинаково больших наборов консенсуса выбран в качестве лучшего.
  3. predict(X): возвращает прогнозируемые значения с использованием линейной модели, которая используется для вычисления остаточной ошибки с использованием функции потерь.

Документация для RANSAC, реализованная в SciPy Cookbook , немного более проста в своих требованиях к методам, которые должны быть реализованы данным классом модели:

def fit(self, data):
"""Given the data fit the data with your model and return the model (a vector)"""
def get_error(self, data, model):
"""Given a set of data and a model, what is the error of using this model to estimate the data """

Это имеет смысл:

  1. Функция fit() возвращает оценку параметров модели с учетом выборки наблюдаемых точек данных.Размер выборки равен количеству точек данных, необходимых для соответствия модели.
  2. Функция get_error() работает как с наблюдаемыми данными, так и с оценкой параметров модели и вычисляет погрешность между наблюдаемыми точками данных ипредсказанные точки данных дают оценку параметров модели.

Из того, что я могу сказать, RANSACRegressor из sk-learn распаковал наблюдаемые SciPy data в X и y, где y = f(X;param_vec) и f - это заданное функциональное отношение, возможно, нелинейное.param_vec - это набор параметров модели, которые должны оцениваться с использованием RANSAC.

Имеет смысл, что fit(X,y) возвращает оценку параметров модели и является функцией наблюдаемых данных.Для меня не имеет смысла, что predict(X) является исключительно функцией X.Для создания набора прогнозируемых точек данных (y_predicted) также требуется оценка параметров модели param_vec.

Чего мне не хватает?Я неправильно понял X и y?Я хотел бы понять, как param_vec вписывается в методы класса base_estimator.

...