В фрейме данных PySpark (2 миллиона * 7000). После поиска по ключевому слову в столбце. Я хочу более 10 записей, а затем пропустить 10 записей, затем снова следующие 10 записей. но из-за разбиения я не могу поставить индексирование на точный фрейм данных. Я узнал, что через формат XML Input это возможно. но не знаю процесс. Пожалуйста, предложите