Как преобразовать список строк в векторное пространство на основе сходства - PullRequest
0 голосов
/ 07 ноября 2019

Я хотел получить векторное представление строк в списке, чтобы в нем можно было использовать любые алгоритмы кластеризации.

Рассмотрим список из 3 строк:

Текст |Векторное представление

hey: 0,0567

hey you: 0,0598

крокодил: 0,1789

Представление вектора должно быть выполнено таким образом на основе сходстваstrings.

Я попробовал следующий фрагмент кода, который использует тензор потока:

message_embeddings = session.run(embed(list(df2['Data Operation Type'])))

Это дает мне нужный результат, но проблема в том, что для его запуска требуется слишком много времени. ,Пожалуйста, помогите мне с чем-нибудь, что не займет много времени.

...