Как BigQuery ML работает с NULL числовыми функциями? - PullRequest
0 голосов
/ 11 декабря 2018

С помощью категориальных функций мы видим, что BigQuery ML автоматически создает фиктивную переменную "_null_filler", запустив ML.WEIGHTS на созданной модели, что имеет смысл.

В случае числовых функций отсутствуетзначения вменяются с использованием среднего или что-то еще?И упоминаются ли эти два поведения где-либо в официальной документации?

1 Ответ

0 голосов
/ 12 декабря 2018

Импутация - это процесс в статистике замены отсутствующих данных замененными значениями.При обучении пропущенные значения возникают, когда BigQuery встречает нулевое значение в наборе данных.В прогнозе, пропущенные значения могут возникать, когда BigQuery встречает нулевое значение или ранее невидимое значение.В следующих документах показано, как BigQuery ML обрабатывает пропущенные данные в различных случаях.

Для числовых типов (которые автоматически стандартизируются BigQuery ML), нулевые значения будут заменены средним значением, рассчитанным по формуле:столбец объектов в исходном наборе входных данных как для обучения, так и для прогнозирования.

Для столбцов с однократным кодированием добавлена ​​дополнительная категория, к которой будут привязаны все нулевые значения для обучения и прогнозирования.При прогнозировании невидимым данным фактически присваивается вес 0.

Мы пропускаем эту информацию в наших общедоступных документах.Мы работаем над добавлением этого прямо сейчас.Спасибо за то, что подняли это.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...