Предупреждение: я - глубокий учитель, нуб
Я тренирую свою двухслойную модель Lstm на наборе данных шуток (231657 шуток) и хочу знать 4 вещи:
Я тренирую его сейчас на 50 символов в предложении, если я хочу, чтобы оно генерировало новые шутки. Нужно ли мне сначала вводить 50 символов или можно случайно выбрать один символ, чтобы начать предложение / шутку?
Разве бесполезно тренировать его только на 50 символов за 1,8 млн. всего (вектор [10800001, 50, 1]) или это хорошо?
Я использовал класс, где я инициировал свою модель, чтобы я мог ее назвать, к сожалению, если я хочу создать длинное предложение / несколько предложений, мне нужно вызывать мой прогнозный оператор более одного раза, проблема в том, что мой прогноз Оператор сначала инициирует модель, а затем прогнозирует значение, поэтому я должен использовать tf.reset_default_graph()
, но через некоторое время это займет больше времени.
Итак, что я должен сделать, чтобы предотвратить эту проблему? Должен ли я инициировать модель в основном скрипте или что-то вроде этого?
- Как решить проблему с растущим текстом? В настоящее время я принимаю форму ввода и использую ее для инициализации модели в моем классе, но разве это хорошая идея?