В общем, я бы посоветовал использовать понимание списка, чтобы создать что-то вроде нужного вам списка, но конкретный список кортежей, который вам нужен, это именно то, что производит enumerate
(но мы должны использовать выводиз enumerate
путем явного построения из него list
для получения фактического списка):
df = spark.createDataFrame(list(enumerate(prosecced_text)), ["id", "items"])
Что делает enumerate
, так это возвращает итератор, который выдает (index,value)
кортежей, где index
начинается с 0
по умолчанию, а value
- это каждый соответствующий элемент повторяемого элемента, передаваемый в enumerate
.
В соответствии с удаленным комментарием @ pault конкретным методом spark.createDataFrame
принимает любой тип итерации в качестве первого аргумента, поэтому вам даже не нужен включающий вызов list
в указанном выше конкретном случае.Это будет просто работать, если вы передадите enumerate(prosecced_text)
напрямую.