У меня есть фрейм данных с начальным и конечным индексами символов слова / фразы, которые мне нужно пометить в соответствии с аннотацией IOB.
сегментов:
start end keyword
0 4 10 voices
1 12 26 hallucinations
и строка: Any voices, hallucinations ? [SEP] No.
Пример вывода:
O B-seg B-seg O
Поскольку это тег IOB, первое слово между начальным и конечным индексом должно быть «B-seg»и другие слова между ними должны быть «я-сег».Все остальные слова в предложении должны быть «О».Вы можете обратиться к приведенному выше примеру вывода.
Как мне это сделать в python?