Проблема с маркировкой текста в инструменте Annontation - PullRequest
0 голосов
/ 06 мая 2019

Я использую инструмент аннотации Doccano для маркировки текста. Я импортирую данные, используя json, который выглядит следующим образом

{"id":23045, "text": "Egypt is an awesome place to see", "labels" : [ [0, 7,"place"]]}
{"id":23046, "text": "swiss also something like this", "labels" : [[0, 6,"place"]]}

при загрузке данных в наборе данных отображается порядковый номер для выполненной загрузки. Позже я делаю пометки другим ярлыком под названием «наречие» и загружаю измененные данные, которые выглядят как

{"id":123, "text": "Egpyt is an awesome place to see", "annotations" : [{"label":8, "start_offset":0, "end_offset":7, "user":"1"],["label":9, "start_offset":8, "end_offset":15, "adverb", "user":"1"]], "meta":{}}
{"id":124, "text": "swiss also something like this", "annotations" : [{"label":8, "start_offset":0, "end_offset":6, "user":1}], "meta":{}} 

Я ожидаю, что в результате идентификатор будет равен 23045 и 23046, но я могу понять, что идентификатор в загруженном является фактической последовательностью загрузки. В нем есть «мета» пустой текст, если я хочу сохранить требуемую информацию, например, «мета»: {«id»: 23045}, возможно ли это? В загруженных данных мне нужна информация 23045 для справки и дальнейшего использования. Как включить эту информацию?

...