Как прогнозировать, используя несколько сохраненных моделей? - PullRequest
0 голосов
/ 17 февраля 2019

Я пытаюсь предсказать значения оценки из загруженной сохраненной модели из этого ноутбука.

https://www.kaggle.com/paoloripamonti/twitter-sentiment-analysis/

. Содержит 4 сохраненные модели, а именно:

  1. кодировщик.pkl
  2. model.h5
  3. model.w2v
  4. tokenizer.pkl

Я использую model.h5 мой код здесь:

from keras.models import load_model
s_model = load_model('model.h5')

#predict the result
result = model.predict("HI my name is Mansi")

Но он не может предсказать.

Я думаю, что ошибка в том, что мне сначала нужно токенизировать и кодировать, но я не знаю, как это сделать, используя несколько сохраненных моделей.

Может ли кто-нибудь подсказать мне, как прогнозировать значения и баллы, используя сохраненную модель, как указано в блокноте выше.

1 Ответ

0 голосов
/ 17 февраля 2019

Необходимо предварительно обработать текст перед подачей в модель. Ниже приведен минимальный рабочий скрипт (адаптированный из https://www.kaggle.com/paoloripamonti/twitter-sentiment-analysis/):

import time
import pickle
from keras.preprocessing.sequence import pad_sequences
from keras.models import load_model

model = load_model('model.h5')
tokenizer = pickle.load(open('tokenizer.pkl', "rb"))
SEQUENCE_LENGTH = 300
decode_map = {0: "NEGATIVE", 2: "NEUTRAL", 4: "POSITIVE"}

POSITIVE = "POSITIVE"
NEGATIVE = "NEGATIVE"
NEUTRAL = "NEUTRAL"
SENTIMENT_THRESHOLDS = (0.4, 0.7)

def decode_sentiment(score, include_neutral=True):
    if include_neutral:        
        label = NEUTRAL
        if score <= SENTIMENT_THRESHOLDS[0]:
            label = NEGATIVE
        elif score >= SENTIMENT_THRESHOLDS[1]:
            label = POSITIVE

        return label
    else:
        return NEGATIVE if score < 0.5 else POSITIVE

def predict(text, include_neutral=True):
    start_at = time.time()
    # Tokenize text
    x_test = pad_sequences(tokenizer.texts_to_sequences([text]), maxlen=SEQUENCE_LENGTH)
    # Predict
    score = model.predict([x_test])[0]
    # Decode sentiment
    label = decode_sentiment(score, include_neutral=include_neutral)

    return {"label": label, "score": float(score),
       "elapsed_time": time.time()-start_at}  

predict("hello")

Тест:

predict("hello")

Его вывод:

{'elapsed_time': 0.6313169002532959,
 'label': 'POSITIVE',
 'score': 0.9836862683296204}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...