Классификация текста по Керасу. Точность теста не меняется - PullRequest
0 голосов
/ 22 апреля 2020

Я использую stack-overflow-data.csv.

df = pd.read_csv("dataset/cls/stack-overflow-data.csv")
df.columns = ['sentences', 'tag']

....

sentences = df['sentences'].values
labels = df['label'].values
num_classes = label_encoder.classes_.shape[0]
sentences_train, sentences_test, y_train, y_test = train_test_split(sentences, labels, test_size=0.25, random_state=1000)

.....

tokenize = Tokenizer(num_words=max_words, char_level=False)
tokenize.fit_on_texts(sentences_train) 
X_train = tokenize.texts_to_matrix(sentences_train)
X_test = tokenize.texts_to_matrix(sentences_test)
y_train = to_categorical(y_train, num_classes)
y_test = to_categorical(y_test, num_classes)

. ..............

model = Sequential()
model.add(Dense(512, input_shape=(max_words,)))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes))
model.add(Activation('softmax'))
model.compile(loss='categorical_crossentropy',
              optimizer='adam', metrics=['accuracy'])
history = model.fit(X_train, y_train,
                    epochs=50,
                    verbose=True, 
                    validation_data=(X_test, y_test), batch_size=batch_size)

После этого я попытался построить объект истории и получил следующую картинку: введите описание изображения здесь

Я не понимаю, почему моя кривая точности проверки не увеличивается. Это имеет максимальное значение в эпоху 1 и после этого только уменьшилось. Я подозреваю, что эта кривая должна увеличиться до того же значения (например, около эпохи 10) и после этого остаться с теми же значениями.

...