Я выполняю классификацию текста, используя глубокую нейронную сеть. Моя проблема в том, что я получаю высокую точность 98 для данных поезда, тогда как моя точность проверки составляет 49.
Я пробовал следующее:
- Перемешал данные
- Мои данные о поездах и проверке 80:20 split
- Я использую 100 измерений Vector Glov
Есть предложения?
def get_Model():
model = tf.keras.Sequential([
tf.keras.layers.Embedding(vocab_size+1, embedding_dim, input_length=max_length, weights= . [embeddings_matrix], trainable=False),
tf.keras.layers.Dropout(0.2),
tf.keras.layers.Conv1D(64, 5, activation='relu'),
tf.keras.layers.MaxPooling1D(pool_size=4),
tf.keras.layers.LSTM(64),
tf.keras.layers.Dense(5, activation='softmax')
])
model.compile(loss='sparse_categorical_crossentropy',optimizer="adam",metrics=['acc'])
model.summary()
return model