Я планирую выполнить поиск по сетке с k-кратной перекрестной проверкой (CV), чтобы оптимизировать гиперпараметры LSTM. Допустим, у меня есть n комбинации гиперпараметров и определено k кратное резюме. Это означает, что мне нужно запустить LSTM nxk раз, что может потребовать значительных вычислительных ресурсов.
Q1. Есть ли практический совет, который может сэкономить время?
Чтобы сэкономить время, что, если 1) я разделил все данные тренировки на тест по сравнению с val (например, 80:20), без k-кратного увеличения и нашел оптимальные гиперпараметры; в этом случае nx 1 выполняется и 2) выполнить k -кратное CV для LSTM только с оптическим гиперпараметром, найденным из 1), чтобы продемонстрировать общую производительность выбранного LSTM? Имеет ли это смысл?