Вы никогда не хотите тренироваться на FPGA или на подобном «дешевом» оборудовании. Для обучения требуется гораздо больше памяти и гораздо больше вычислительных мощностей.
Обычный подход состоит в том, чтобы обучить сеть в обычном режиме на графических процессорах, а затем квантовать ее так, как вам нужно, чтобы она работала на ПЛИС. Как только это будет сделано, вы можете попытаться загрузить архитектуру и веса на ПЛИС.
Я бы предположил, что достаточно просто запустить единую сетевую архитектуру, поэтому начните с этого и, возможно, подумайте о его расширении. произвольные архитектуры и запускать.