Question

В фрейме данных PySpark (2 миллиона * 7000). После поиска по ключевому слову в столбце. Я хочу более 10 записей, а затем пропустить 10 записей, затем снова следующие 10 записей. но из-за разбиения я не могу поставить индексирование на точный фрейм данных. Я узнал, что через формат XML Input это возможно. но не знаю процесс. Пожалуйста, предложите

Настройте раздел и сохраните последовательность в PySpark Hadoop

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Настройте раздел и сохраните последовательность в PySpark Hadoop

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов