Конвертировать тройной вложенный список в Dataframe Python - PullRequest
0 голосов
/ 05 ноября 2019

У меня есть этот список данных, которые я хочу преобразовать в фрейм данных:

enter image description here

Есть 22 индекса (давайте переименуем его в docs),и если мы рассмотрим каждый документ (давайте посмотрим на документ 0):

enter image description here

Теперь я хочу перевести этот тройной вложенный список в фрейм данных, где егостолбцы 'Word', 'Pos' и 'Biotag'. Если мы возьмем пример из второго рисунка, таблица будет иметь вид:

Word        Pos      Biotag
____________________________
S7892537B1  NNP      O
-           :        O
High        JJ       O
...

Однако это только данные из первого документа. Я хочу добавить все 22 документа в один фрейм данных и добавить столбец «Документы», в котором указан документ каждой записи, например:

Word        Pos      Biotag    Docs
___________________________________
S7892537B1  NNP      O         0
-           :        O         0
High        JJ       O         0
...
encoding    VBG      O         2
Dev.        NNP      I         2
...
et          NNP      I         22 

Я пробовал это и , что , однако возвращающиеся столбцы всегда не совпадали. Любая помощь приветствуется, спасибо.

1 Ответ

0 голосов
/ 05 ноября 2019

Для одного документа:

df_new = pd.DataFrame(df['Value'].values.tolist(), columns=['Word', 'Pos', 'Biotag'])

Как вы хотите обрабатывать несколько документов?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...