Я выполнил эти шаги, чтобы создать модель Glove с моим собственным набором данных в Google colab.
glove = Glove(no_components=5, learning_rate=0.05)
glove.fit(corpus.matrix, epochs=30, no_threads=4, verbose=True)
glove.add_dictionary(corpus.dictionary)
glove.save('glove.model')
source: https://medium.com/@japneet121 / word-vectorization-using-glove-76919685ee0b
Из того, что я здесь получил, похоже, работает поиск сходства.
Что мне делать дальше, чтобы преобразовать его в модель для классификации текста? Я хочу, чтобы он работал с методами машинного обучения из scikit-learn, такими как SVM, logisti c regression, et c.
Заранее спасибо