Вам необходимо закодировать текст в виде чисел.Никакой машинный алгоритм не может обрабатывать текст напрямую.
Точнее, вам нужно использовать вложение слов (то же самое, что используется для обучения модели).Примером встраивания общих слов являются Word2vec, TF-IDF.
Я предлагаю вам поиграть с sklearn.feature_extraction.text.CountVectorizer
и sklearn.feature_extraction.text.TfidfTransformer
, чтобы ознакомиться с концепцией встраивания.
Однако, если выне используйте то же вложение, которое использовалось для обучения загружаемой модели, вы не получите хороших результатов.