Я работаю над моделью языка и хочу посчитать пары чисел двух последовательных слов.Я нашел примеры такой проблемы на scala
с slicing
функцией.Хотя мне не удалось найти аналогию в pyspark
data.splicing(2).map(lambda (x,y): ((x,y),1).redcueByKey(lambda x,y: x+y)
Полагаю, что-то вроде этого.Обходным решением может быть создание функции, которая находит следующее слово в массиве, но я думаю, что должно быть встроенное решение.