Как извлечь больше, чем просто помечать текстовые элементы в одной аннотации с помощью Google NLP - PullRequest
7 голосов
/ 04 мая 2020

Я создал набор данных, используя извлечение сущности Google NLP, и я загрузил входные данные (файлы тренингов, испытаний, проверки jsonl), такие как формат NLP, которые будут храниться в хранилище Google.

Пример аннотации:

   {
    "annotations": [{
        "text_extraction": {
            "text_segment": {
                "end_offset": 10,
                "start_offset": 0
            }
        },
        "display_name": "Name"
    }],
    "text_snippet": {
        "content": "JJ's Pizza\n "
    }
} {
    "annotations": [{
        "text_extraction": {
            "text_segment": {
                "end_offset": 9,
                "start_offset": 0
            }
        },
        "display_name": "City"
    }],
    "text_snippet": {
        "content": "San Francisco\n "
    }
}

Здесь вводится текст для прогнозирования метки «Имя», «Город» и «Штат»

Лучшая пицца JJ's в Сан-Франциско, Калифорния

Результат на следующем снимке экрана:

predict-data

Я ожидаю, что следующие результаты будут следующими,

Имя : JJ's Pizza Город : Сан-Франциско Штат : CA

...