Оптимизатор FTRL в тензорном потоке не работает - PullRequest
0 голосов
/ 29 июня 2018

Пытался обучать модель LR крупномасштабному набору данных через тензорный поток с оптимизатором FTRL для задачи ctr. Служба tenorflow / sklearn и метод обучения / оценки в порядке. Но производительность в продукте не очень хорошая. Я пытался снизить распределенный уровень, но вопрос не может быть полностью решен. Какие-либо предложения?

1 Ответ

0 голосов
/ 13 августа 2018

Нашли как минимум две причины:

Во-первых, базовая реализация не совсем совпадает с оригинальной документацией. Я не знаю, почему они это делают, нужно объяснение.

Во-вторых, градиенты, используемые при обновлении весов, представляют собой пакетный градиент, что означает обновление весов ps один раз для партии (очень тривиально в современной распределенной системе, но не подходит для сценария в оригинальной статье), в сводке он не использует данные обучения для записи. Лично второй является ключевым моментом.

...