Как использовать TSNE только для word2vec model.most_s Similar? - PullRequest
0 голосов
/ 12 апреля 2019

Я плохо разбираюсь в английском.Извини за это.Я хочу визуализировать мои наиболее похожие результаты модели word2vec.

Я тренировал модель word2vec с помощью своего текста и принес topn = 100 most_similar результаты

Я просто хочу визуализировать результат с помощью TSNE (не все слова моей модели), но я не уверен, как мне это сделать.Мой код здесь.

Ошибка при "X_tsne = tsne.fit_transform(X[:50, :])"

Я думал, что результат также является списком, но он не работал.

vocab = list(result)
X = vocab


tsne = TSNE(n_components = 2)
X_tsne = tsne.fit_transform(X[:50, :]) #Error

df = pd.DataFrame(X_tsne, index = vocab[:50], columns = ['x', 'y'])
df.shape

df.head(10)

fig = plt.figure()
fig.set_size_inches(40, 20)
ax = fig.add_subplot(1, 1, 1)

ax.scatter(df['x'], df['y'])

for word, posi in df.iterrows():
    ax.annotate(word, posi, fontsize = 30)
plt.show()
...