Я создал набор данных, используя извлечение сущности Google NLP, и я загрузил входные данные (файлы тренингов, испытаний, проверки jsonl), такие как формат NLP, которые будут храниться в хранилище Google.
Пример аннотации:
{
"annotations": [{
"text_extraction": {
"text_segment": {
"end_offset": 10,
"start_offset": 0
}
},
"display_name": "Name"
}],
"text_snippet": {
"content": "JJ's Pizza\n "
}
} {
"annotations": [{
"text_extraction": {
"text_segment": {
"end_offset": 9,
"start_offset": 0
}
},
"display_name": "City"
}],
"text_snippet": {
"content": "San Francisco\n "
}
}
Здесь вводится текст для прогнозирования метки «Имя», «Город» и «Штат»
Лучшая пицца JJ's в Сан-Франциско, Калифорния
Результат на следующем снимке экрана:
Я ожидаю, что следующие результаты будут следующими,
Имя : JJ's Pizza Город : Сан-Франциско Штат : CA