Я вижу много функций в пакете text2vec для токенизации строк и создания DTM, но есть ли способ создания последовательностей? В библиотеке Rstudio keras это есть, но она невероятно медленная. Идея состоит в том, что вместо возврата матрицы вы возвращаете список векторов токенизированных элементов, по одному на элемент во входном векторе.
https://keras.rstudio.com/reference/texts_to_sequences.html
Это похоже на то, что должно быть очевидным, но я не могу этого найти. ?