Пространство обобщить модель архитектуры - PullRequest
0 голосов
/ 12 марта 2020

Я новичок в НЛП и нейронных сетях и пытаюсь понять идею, лежащую в основе spaCy. Я знаю, как работает CNN в целом. Согласно этой немецкой модели документации, это многозадачный CNN, обученный на корпусах TIGER и WikiNER.

Таким образом, модель снабжается корпусом в качестве обучающих данных и впоследствии может, например, сделать POS-тегирование для моего конкретного c предложения.

Я привык к этому, затем дело доходит до нейронных сетей, чтобы изучить краткое изложение модели, как в следующем примере.

Layer (type)                 Output Shape              Param #   
=================================================================
embedding_1 (Embedding)      (None, 90, 40)            800000    
_________________________________________________________________
dropout_1 (Dropout)          (None, 90, 40)            0         
_________________________________________________________________
conv1d_1 (Conv1D)            (None, 88, 250)           30250     
_________________________________________________________________
global_max_pooling1d_1 (Glob (None, 250)               0         
_________________________________________________________________
dense_1 (Dense)              (None, 250)               62750     
_________________________________________________________________
dropout_2 (Dropout)          (None, 250)               0         
_________________________________________________________________
activation_1 (Activation)    (None, 250)               0         
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 251       
_________________________________________________________________
activation_2 (Activation)    (None, 1)                 0         
=================================================================

Так что я могу go через сеть и проверить, какие слои к ней применены.

Я думаю, что очень важно проверить архитектуру модели, чтобы понять, как она работает. Но для спа я не могу понять, как именно модель построена. Не могли бы вы объяснить, как в СПА-центре CNN загружаются данные обучения, проходя обучение до создания модели?

1 Ответ

0 голосов
/ 12 марта 2020

Я думаю, что вы имеете в виду это https://spacy.io/models/de и для этого вы можете видеть, что конвейер состоит из тегера, парсера и нэра.

В документации spacy для моделей вы можете посмотреть раздел архитектуры (https://spacy.io/models), в котором модель NER с остаточными CNN объясняется в видео: https://youtu.be/sqDHBH9IjRU

Надеюсь, что поможет.

...