Создайте текстовый файл, используя рамки данных Pandas - PullRequest
0 голосов
/ 17 октября 2019

Я новичок в питоне. У меня есть следующий фрейм данных

Document_ID OFFSET  PredictedFeature   word
    0         0             2000        abcd
    0         8             2000         is
    0         16            2200         a
    0         23            2200        good
    0          25           315        XXYYZZ
    1          0            2100       but
    1          5            2100       it 
    1          7            2100       can
    1          10           315        XXYYZZ

Теперь, в этом фрейме данных я пытаюсь создать файл, который может быть в читаемой форме, например,

abcd равен 2000,хороший 2200, но он может 2100,

PredictedData    feature      offset  endoffset
  abcd is           2000       0         8
  a good           2200        16      23
   NewLine         315         25     25
 but it can        2100         0      7

этот тип данных. где, если вы видите, что я пробую ту же последовательность предсказанных функций, то я объединяю те же слова со значением. Если есть функция 315, я даю ей новую строку. Так, есть ли способ, которым я могу это сделать? Любая помощь будет оценена. Thnaks

1 Ответ

0 голосов
/ 17 октября 2019

IIUC, вы можете сделать groupby():

(df.groupby(['Document_ID', 'PredictedFeature'],as_index=False)
   .agg({'word':(' '.join),
         'OFFSET':('min','max')
        })
)

Выход:

  Document_ID PredictedFeature        word    OFFSET    
                                      join    min max
0           0              315      XXYYZZ     25  25
1           0             2000     abcd is      0   8
2           0             2200      a good     16  23
3           1              315      XXYYZZ     10  10
4           1             2100  but it can      0   7
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...