Вот примерная пара слов / тегов предложений, взятая из кадра данных в NER
B-per Mr
B-per .
I-per Trump
O ’
O s
O tweets
O began
O just
O moments
O after
O a
B-org Fox
I-org News
O report
O by
B-per Mike
I-per Tobin
0 who
0 never
0 arrived
this for example has index of 1 to 61, by manually counting down the columns from B-per to I-per
Теперь я хочу найти начальный и конечный интервал для разных предложений по всему кадру данных, который в данном случае первый B-per до последнего I-per.
Таким образом, я чувствую, что могу разбить его на серию шагов
- найти тег первого лица B-per
- найти последний I-per
- индексируйте предложение и найдите индекс первой буквы слова B-per
- найдите индекс последней буквы слова I-per.
Как мне это сделать? 1019 * это?