Есть похожий вопрос , но вывод, который я ищу, отличается.
У меня есть фрейм данных, в котором перечислены все слова (столбцы) и их количество для каждого документа(строки).
Это выглядит следующим образом:
{'orange': {0: '1',
1: '3'},
'blue': {0: '0',
1: '2'}}
Выходные данные должны "заново создать" исходный документ в виде пакета слов следующим образом:
corpus = [
['orange'],
['orange', 'orange', 'orange', 'blue', 'blue']]
Как это сделать?