Отображение меток / ярлыков слов в их индексы - PullRequest
0 голосов
/ 24 апреля 2020

Вот примерная пара слов / тегов предложений, взятая из кадра данных в NER

B-per   Mr
B-per   .
I-per   Trump
O        ’
O        s
O       tweets
O       began
O       just
O       moments
O       after
O       a
B-org   Fox
I-org   News
O       report
O       by
B-per   Mike
I-per   Tobin
0       who 
0       never
0       arrived

this for example has index of 1 to 61, by manually counting down the columns from B-per to I-per 

Теперь я хочу найти начальный и конечный интервал для разных предложений по всему кадру данных, который в данном случае первый B-per до последнего I-per.

Таким образом, я чувствую, что могу разбить его на серию шагов

  1. найти тег первого лица B-per
  2. найти последний I-per
  3. индексируйте предложение и найдите индекс первой буквы слова B-per
  4. найдите индекс последней буквы слова I-per.

Как мне это сделать? 1019 * это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...