Получение повторяющихся прогнозов при тестировании модели NMT - PullRequest
0 голосов
/ 13 сентября 2018

Я экспериментировал с OpenNMT-tf (https://github.com/OpenNMT/OpenNMT-tf) с моими собственными данными, представляющими собой последовательность чисел в качестве исходных данных и текстовых предложений в качестве цели. Корпус длиной около 20 000 строк каждый как правило, неровной длины.

Когда я запускаю onmt-main infer --config config/opennmt-defaults.yml config/data/toy-ende.yml --features_file data/toy-ende/src-test.txt, используя файл новых входных данных src-test.txt, он повторяет одно и то же предложение снова и снова, что и результаты, что является, по-видимому, случайным предложением (и тем, которое присутствует в целевом обучении). данные). В процессе прогнозирования я надеялся генерировать предложения, которые отличались от обучающих данных, являясь путаницей новых предложений (вероятно, с разным уровнем смысла).

Я использую их модель NMTBig с 200000 шагов. Размер луча 12, обучение 1,0, скорость затухания 0,7, размер партии 64, размер партии вывода 30.

Я что-то не так делаю, что приводит к этим повторным результатам? И кто-нибудь может подсказать, что я могу сделать, чтобы получить желаемые результаты?

...