Как получить слова из Wiki-words-250-with-normalization - PullRequest
0 голосов
/ 17 июня 2020

Я загрузил встраивание: embed = hub.load ("https://tfhub.dev/google/Wiki-words-250-with-normalization/2")

форма матрицы вложения составляет 1009375x250, и я могу легко получить вектор встраивания для каждого слова, используя x = embed (["hello"]), например.

Я хотел бы получить все слова, которые существуют в матрице внедрения. ie "a", .. "apple", ... "Zulu", ... et c - весь словарь ... как их получить?

1 Ответ

0 голосов
/ 24 июня 2020

Вы можете найти словарь в tokens.txt в подкаталоге assets в каталоге api.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...