Я новичок в этой области, поэтому мой вопрос может показаться глупым. Недавно я наткнулся на следующие API-интерфейсы tenorflow
tf.estimator.WarmStartSettings(
ckpt_to_initialize_from, vars_to_warm_start='.*', var_name_to_vocab_info=None,
var_name_to_prev_var_name=None
)
и
tf.estimator.VocabInfo(
new_vocab, new_vocab_size, num_oov_buckets, old_vocab, old_vocab_size=-1,
backup_initializer=None, axis=0
)
и хочет использовать их при продолжении обучения и дополнительном обучении. Мой подход к «теплому запуску» заключается в том, что мы берем ранее обученную модель и используем ее для обучения на дополнительных наборах данных.
В соответствии с примером, если у нас есть файл vocab.txt, мы можем использовать это таким образом:
ws = WarmStartSettings(
ckpt_to_initialize_from="/tmp",
var_name_to_vocab_info={
<feature_name>: vocab_info
})
Вот мои вопросы: 1. Кажется, что каждый vocab_info соответствует функции. Так что в случае, когда моя модель имеет несколько функций, нужно ли вводить несколько вокаб-файлов для каждой функции?
Для имени объекта, как мы получаем их с уже обученной моделью / контрольной точкой?
Как мы обычно получаем словари (содержимое в файле vocab)?