Сетевая архитектура определяется в модуле _.ml специально в функции build_text_classifier
.
Код, связанный с обучением, находится в модуле конвейера, в частности, в TextCategorizer
class.
Некоторые параметры, такие как drop_out, batch_size и количество эпох, могут быть настроены, как показано в примере, вы также можете изменить архитектуру сети, но для этого вам необходимознать о платформе spaCy, которая называется Thinc https://github.com/explosion/thinc и некотором Cython.
Я не знаю ни одной статьи, описывающей модель, но это видео дает отличное описание ее https://www.youtube.com/watch?v=sqDHBH9IjRU