Пример Gensim, TypeError: между ошибкой str и int - PullRequest
0 голосов
/ 03 ноября 2018

При запуске приведенного ниже кода. этот Python 3.6, последняя библиотека Gensim в Jupyter

for model in models:
       print(str(model))
       pprint(model.docvecs.most_similar(positive=["Machine learning"], topn=20))

[1]: https://github.com/RaRe-Technologies/gensim/blob/develop/docs/notebooks/doc2vec-wikipedia.ipynbвведите описание изображения здесь

Ответы [ 2 ]

0 голосов
/ 05 ноября 2018
string= "machine learning".split()

doc_vector = model.infer_vector(string)
out= model.docvecs.most_similar([doc_vector])

Я не уверен на 100%, так как использую более свежую версию, но я думаю, что проблема связана с тем фактом, что функция most_s Similar ожидает строку, отображенную в пространстве признаков, а не необработанную строку.

0 голосов
/ 04 ноября 2018

Основная проблема в том, что 'Machine learning' не является известным тегом в вашей модели. (Может быть, ваша модель знает 'machine learning' или 'machine_learning' или еще что-нибудь подобное?)

Труднее понять, что это реальная проблема, из-за плохого сообщения об ошибке из кода в данном случае. Это известная проблема в проекте gensim:

https://github.com/RaRe-Technologies/gensim/issues/1737

...