В чем разница между результатом оценки после создания модели и оценкой с использованием ML.Evaluate в BigQuery ML? - PullRequest
1 голос
/ 24 февраля 2020

Я пытаюсь обучить модель с использованием BigQuery ML и немного запутался в функциональности.

Когда я использую функцию CREATE MODEL для создания модели, она позволяет мне разбивать данные на обучение и оценка. Допустим, я использую AUTO_SPLIT, и мои строки находятся в диапазоне от 500 до 50000, в соответствии с документацией, 20% данных используются в качестве оценки в случайном разделении. Могу ли я предположить, что оставшиеся 80% будут использованы для обучения?

Таким образом, с помощью этой функции CREATE MODEL я в основном тренируюсь и оцениваю одновременно. Это понимание правильно? Если да, то какова цель функции ML.Evaluate?

Ответы [ 2 ]

1 голос
/ 25 февраля 2020

CREATE MODEL оператор обучает новую модель в указанном наборе данных. Один из вариантов - установить DATA_SPLIT_METHOD, который разделяет входные данные на два разных набора ( обучение и оценка ) в соответствии с методом разделения. Данные оценки используются, чтобы избежать перегрузки посредством ранней остановки, и не будут использоваться для обучения модели. Набор оценки часто называют проверкой набором.

С другой стороны, функция ML.EVALUATE используется для оценки метрик модели с использованием общих метрик, применимых к типу. модели поставляются. Он используется для количественной оценки производительности модели.

0 голосов
/ 25 февраля 2020

ML.EVALUATE можно использовать для проверки модели на предмет новых данных, которые не были доступны на момент обучения модели.

Если вы вызываете ML.EVALUATE только с моделью и без таблицы данные для оценки вернут оценку, рассчитанную во время обучения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...