маркировка последовательности с использованием python-crfsuite - PullRequest
0 голосов
/ 28 декабря 2018

Привет. Я пытаюсь создать модель маркировки последовательности для следующей задачи, используя python-crfsuite.

Мне нужно проанализировать информацию из абзаца, например:

Приветвсе, я хочу забронировать билеты для деталей ниже HKG в LAX на 24 декабря имена пассажиров: Джон, Riya BNE в DXB на 1 января.имя пассажира: Майк пассажир: Аллен из COK в DEL на завтра

Из приведенных выше предложений, и я хочу разобрать детали, как,

ticket1:
------------
passengers: John, Riya
origin: HKG
destination: LAX
date: 24th Dec 

ticket2:
------------
passengers: Mike
origin: BNE
destination: DXB
date: 1st JAN

ticket3:
-------------
passenger: Allen
origin: COK    
destination: DEL
date: tomorrow

Кто-нибудь есть идеи, чтобы проанализироватьданные без разрыва связей.Любые предложения или ссылки

Образец набора данных, который я использую для обучения

Hi      NNP     O
all     DT      O
,       ,       O
I       PRP     O
want    VBP     O
to      TO      O
book    NN      O
a       DT      O
tickets NNS     O
for     IN      O
below   IN      O
details NNS     O
HKG     NNP     B-origin
to      TO      O
LAX     VB      B-dest
on      IN      O
24th    CD      B-date
Dec.    NNP     I-date
passenger       NN      O
names   NNS     O
:       :       O
John    NNP     passenger
,       ,       B-passenger
Riya    NNP     B-passenger
BNE     NNP     B-origin
to      TO      O
DXB     NNP     B-dest
on      IN      O
B-1st   CD      date
JAN.    NNP     I-date
passenger       NN      O
name    NN      O
:       :       O
Mike    JJ      B-passenger
passenger       NN      O
:       :       O
Allen   NNP     B-passenger
from    IN      O
COK     NNP     B-origin
to      TO      O
DEL     NNP     B-dest
for     IN      O
tomorrow        NN      B-date

Заранее спасибо!

...