Привет. Я пытаюсь создать модель маркировки последовательности для следующей задачи, используя python-crfsuite.
Мне нужно проанализировать информацию из абзаца, например:
Приветвсе, я хочу забронировать билеты для деталей ниже HKG в LAX на 24 декабря имена пассажиров: Джон, Riya BNE в DXB на 1 января.имя пассажира: Майк пассажир: Аллен из COK в DEL на завтра
Из приведенных выше предложений, и я хочу разобрать детали, как,
ticket1:
------------
passengers: John, Riya
origin: HKG
destination: LAX
date: 24th Dec
ticket2:
------------
passengers: Mike
origin: BNE
destination: DXB
date: 1st JAN
ticket3:
-------------
passenger: Allen
origin: COK
destination: DEL
date: tomorrow
Кто-нибудь есть идеи, чтобы проанализироватьданные без разрыва связей.Любые предложения или ссылки
Образец набора данных, который я использую для обучения
Hi NNP O
all DT O
, , O
I PRP O
want VBP O
to TO O
book NN O
a DT O
tickets NNS O
for IN O
below IN O
details NNS O
HKG NNP B-origin
to TO O
LAX VB B-dest
on IN O
24th CD B-date
Dec. NNP I-date
passenger NN O
names NNS O
: : O
John NNP passenger
, , B-passenger
Riya NNP B-passenger
BNE NNP B-origin
to TO O
DXB NNP B-dest
on IN O
B-1st CD date
JAN. NNP I-date
passenger NN O
name NN O
: : O
Mike JJ B-passenger
passenger NN O
: : O
Allen NNP B-passenger
from IN O
COK NNP B-origin
to TO O
DEL NNP B-dest
for IN O
tomorrow NN B-date
Заранее спасибо!