По поводу вашего второго вопроса: при передаче образцов в вашу сеть вы хотите, чтобы ваши образцы были как можно более независимыми друг от друга.
Например, предположим, что вы пытаетесь классифицировать изображения и половину ваш набор данных состоит из изображений кошки (и другой половины собак). Если вы не перетасовываете свой набор данных, ваша сеть узнает, что первая выборка относится к кошке, вторая - к кошке и так далее. Что он узнает, увидев половину набора данных? Ничего. Хуже того, ваша сеть научится всегда отвечать «кошка» независимо от ввода. Этот феномен обобщается на классификаторы с более чем двумя классами и даже на регрессию.
Для регрессии, если вы хотите спрогнозировать таймер ie и вы соответствуете последующим точкам, ваша сеть будет соответствовать текущему паттерну и будет потеряна как только появится следующий шаблон.
Перетасовка вашего набора данных предотвращает эту проблему, поскольку каждый образец будет гораздо менее зависим от предыдущего, что позволит вашей сети учиться на различных примерах, имеющих отношение к ее обучению.