В ACL 2018 была предложена интересная архитектура под названием «отключенный RNN».Это можно рассматривать как специальный 1D CNN, где ядра свертки заменяются рекуррентными единицами.Бумага в http://aclweb.org/anthology/P18-1215.Однако, когда я пытаюсь воспроизвести модель, я не могу получить хорошие результаты, она всегда хуже, чем Conv1D или GRU.Моя реализация на https://github.com/zepingyu0512/disconnected-rnn, написана в keras-tenorflow.Возможно, мой код неверен или параметры должны быть настроены, поэтому, пожалуйста, помогите, если интересно.