R пакет text2vec - токенизировать в последовательности - PullRequest
2 голосов
/ 11 марта 2019

Я вижу много функций в пакете text2vec для токенизации строк и создания DTM, но есть ли способ создания последовательностей? В библиотеке Rstudio keras это есть, но она невероятно медленная. Идея состоит в том, что вместо возврата матрицы вы возвращаете список векторов токенизированных элементов, по одному на элемент во входном векторе.

https://keras.rstudio.com/reference/texts_to_sequences.html

Это похоже на то, что должно быть очевидным, но я не могу этого найти. ?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...