Импутация - это процесс в статистике замены отсутствующих данных замененными значениями.При обучении пропущенные значения возникают, когда BigQuery встречает нулевое значение в наборе данных.В прогнозе, пропущенные значения могут возникать, когда BigQuery встречает нулевое значение или ранее невидимое значение.В следующих документах показано, как BigQuery ML обрабатывает пропущенные данные в различных случаях.
Для числовых типов (которые автоматически стандартизируются BigQuery ML), нулевые значения будут заменены средним значением, рассчитанным по формуле:столбец объектов в исходном наборе входных данных как для обучения, так и для прогнозирования.
Для столбцов с однократным кодированием добавлена дополнительная категория, к которой будут привязаны все нулевые значения для обучения и прогнозирования.При прогнозировании невидимым данным фактически присваивается вес 0.
Мы пропускаем эту информацию в наших общедоступных документах.Мы работаем над добавлением этого прямо сейчас.Спасибо за то, что подняли это.