Сравнение подходов к обучению моделей - PullRequest
0 голосов
/ 27 мая 2020

Предположим, что у меня есть набор данных, и из-за ограничений, налагаемых средами Kaggle Notebook Environments, я решил разбить большой набор данных на «блоки»; A, B и C. Кроме того, я бы хотел обучить модель 10 эпох. Имеет ли значение, если я тренирую модель следующим образом:

A ---> 10 эпох

B ---> 10 эпох

C - -> 10 эпох

По сравнению с этим подходом:

A ---> B ---> C [Epoch 1] ---> A ---> B - -> C [Эпоха 2] --->… ---> A ---> B ---> C [Эпоха 10]

Кроме того, если есть разница, которую я думаю, что есть, но не уверен, один подход лучше другого?

1 Ответ

1 голос
/ 28 мая 2020

Для машинного обучения в основном вам придется собрать все данные обучения вместе, чтобы ваша модель не пропустила ни один шаблон, который содержит ваш набор данных. И я бы сказал, что перед обучением модели нужно сделать большой шаг - Shuffle . Представляя, что вас все время просят заниматься чистой математикой, и вдруг ваш учитель поставил вас перед проблемой по географии и попросил решить ее, вы как бы не знаете, что как-то делать, машина это то же самое! Поэтому обязательно используйте все данные для обучения вашей модели, и если ваш A ---> B ---> C [Epoch 1] представляет собой перетасованные данные, то это прекрасно, или вам придется перетасовать их.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...