Как создать набор данных FSNS с моим собственным изображением для внимания модель тензор потока OCR - PullRequest
0 голосов
/ 09 мая 2019

Я хочу применить внимание-ocr, чтобы обнаружить все цифры на табло автомобилей.Я прочитал ваш файл README.md внимания_ocr на github (https://github.com/tensorflow/models/tree/master/research/attention_ocr),), а также то, как я должен использовать свои собственные данные изображений для обучения модели со страницей StackOverFlow. (https://stackoverflow.com/a/44461910/743658) Однако яя не получил никакой информации о том, как сохранить аннотацию или метку изображения, или о формате этой проблемы. Для модели обнаружения объектов я смог создать свой набор данных с помощью LabelImg и преобразовать его в CSV-файл, и, наконец, создать .tfrecordфайл. Я хочу создать файл .tfrecord в формате набора данных FSNS.

Можете ли вы дать мне совет, как пройти этот этап обучения?

1 Ответ

0 голосов
/ 09 мая 2019

Пожалуйста, перечитайте упомянутый ответ в нем есть раздел, объясняющий, как хранить аннотацию. Он хранится в трех функциях image/text, image/class и image/unpadded_class. Поле image/text используется для визуализации, некоторые модели поддерживают незаполненные последовательности и используют image/unpadded_class, в то время как версия по умолчанию опирается на текст, дополненный нулевыми символами, чтобы иметь такую ​​же длину, сохраненную в функции image/class. Вот выдержка для хранения текстовой аннотации:

char_ids_padded, char_ids_unpadded = encode_utf8_string(
   text, charset, length, null_char_id)
example = tf.train.Example(features=tf.train.Features(
  feature={
    'image/class': _int64_feature(char_ids_padded),
    'image/unpadded_class': _int64_feature(char_ids_unpadded),
    'image/text': _bytes_feature(text)
    ...
  }
))
...