Где можно настроить CNN, используемый Spacy TextCategorizer? - PullRequest
0 голосов
/ 18 ноября 2018

Согласно комментарию в верхней части TextCategorizer,

Обучение сверточного классификатора текста нейронной сети в наборе данных IMDB с использованием компонента TextCategorizer.Набор данных будет загружен автоматически через встроенный загрузчик набора данных Thinc.Модель добавлена ​​в spacy.pipeline, а прогнозы доступны через doc.cats.Для получения более подробной информации см. Документацию: * Обучение: https://spacy.io/usage/training

Где находится код для CNN?Можно ли настроить CNN?Есть ли исследовательская работа, на которой основывается реализация?

1 Ответ

0 голосов
/ 19 ноября 2018

Сетевая архитектура определяется в модуле _.ml специально в функции build_text_classifier.

Код, связанный с обучением, находится в модуле конвейера, в частности, в TextCategorizer class.

Некоторые параметры, такие как drop_out, batch_size и количество эпох, могут быть настроены, как показано в примере, вы также можете изменить архитектуру сети, но для этого вам необходимознать о платформе spaCy, которая называется Thinc https://github.com/explosion/thinc и некотором Cython.

Я не знаю ни одной статьи, описывающей модель, но это видео дает отличное описание ее https://www.youtube.com/watch?v=sqDHBH9IjRU

...