Я хочу использовать функциональность расширения Doc от Spacy.Мне нужно преобразовать столбцы dataframe в кортежи, состоящие только из текста и словаря с парами значений имени столбца.
Использование pandas dataframe.to_dict (orient = 'records') подходит близко, но не позволяет мне использовать только 1 столбец или выбирать определенные столбцы.Применение метода to_dict () к одному столбцу данных также не приближает меня к желаемому макету.Стоит ли использовать другой подход?
import pandas as pd
df = pd.DataFrame({
'Textitself': ['Just a text'],
'Textkey': [502]
})
otherlayout = df.to_dict('records')
print(otherlayout)
Ниже вы найдете формат, который я пытаюсь получить.
desired_format = [('Just a text',{'Textkey' : 502 }), ('One more text', {'Textkey' : 103 })]
print(desired_format)