Таблица AutoML Google тасует мои образцы данных перед обучением / оценкой? - PullRequest
0 голосов
/ 10 июля 2019

Я искал документацию, но все еще не знаю, тасует ли служба данные перед обучением / оценкой.Мне нужно это знать, потому что по данным есть временные ряды, которые были бы реалистичны для оценки обученной модели по образцам более раннего периода времени.

Может кто-нибудь, пожалуйста, дайте мне знать ответ или подскажите, как это вычислитьиз?Я знаю, что могу экспортировать результаты оценки и настраивать их, но BigQuery, похоже, не соответствует порядку исходных данных, и в данных нет функции абсолютного времени.

1 Ответ

0 голосов
/ 19 июля 2019

Не тасует, а разбивает.

Посмотрите здесь: Об управлении разделением данных . Там написано:

По умолчанию таблицы AutoML случайным образом выбирают 80% строк данных для обучения, 10% для проверки и 10% для тестирования.

Если ваши данные чувствительны ко времени, вы должны использовать столбец Time .

Используя его, таблицы AutoML будут использовать самые первые 80% строк для обучения, следующие 10% строк для проверки и последние 10% строк для тестирования.

...