Я новичок в НЛП и нейронных сетях и пытаюсь понять идею, лежащую в основе spaCy. Я знаю, как работает CNN в целом. Согласно этой немецкой модели документации, это многозадачный CNN, обученный на корпусах TIGER и WikiNER.
Таким образом, модель снабжается корпусом в качестве обучающих данных и впоследствии может, например, сделать POS-тегирование для моего конкретного c предложения.
Я привык к этому, затем дело доходит до нейронных сетей, чтобы изучить краткое изложение модели, как в следующем примере.
Layer (type) Output Shape Param #
=================================================================
embedding_1 (Embedding) (None, 90, 40) 800000
_________________________________________________________________
dropout_1 (Dropout) (None, 90, 40) 0
_________________________________________________________________
conv1d_1 (Conv1D) (None, 88, 250) 30250
_________________________________________________________________
global_max_pooling1d_1 (Glob (None, 250) 0
_________________________________________________________________
dense_1 (Dense) (None, 250) 62750
_________________________________________________________________
dropout_2 (Dropout) (None, 250) 0
_________________________________________________________________
activation_1 (Activation) (None, 250) 0
_________________________________________________________________
dense_2 (Dense) (None, 1) 251
_________________________________________________________________
activation_2 (Activation) (None, 1) 0
=================================================================
Так что я могу go через сеть и проверить, какие слои к ней применены.
Я думаю, что очень важно проверить архитектуру модели, чтобы понять, как она работает. Но для спа я не могу понять, как именно модель построена. Не могли бы вы объяснить, как в СПА-центре CNN загружаются данные обучения, проходя обучение до создания модели?