Один такой набор данных обслуживается EdisonTD. http://www.edisontd.net
Edison TD (проездные документы) - это база данных проездных документов и других документов, связанных с поездками, из большинства стран мира. База данных разработана голландскими властями в сотрудничестве с властями Канады, Австралии, США, Объединенных Арабских Эмиратов и Интерпола.
Еще один - Прадо: https://www.consilium.europa.eu/prado/en/prado-start-page.html
База данных PRADO, созданная Советом Европейского Союза, содержит информацию о проездных документах и документах, удостоверяющих личность, и выбранные функции безопасности. , База данных поддерживается экспертами стран ЕС вместе с экспертами из Исландии, Норвегии и Швейцарии. ПРАДО в основном содержит информацию о документах, удостоверяющих личность, из стран ЕС, но также включает некоторые страны за пределами ЕС. PRADO общедоступен.
Насколько мне известно, других опубликованных c наборов данных не существует, поскольку они по определению содержат данные, идентифицирующие личность.
Если вы планируете обучать модель OCR, у вас может быть приличное количество выборок с этими наборами данных. Однако вам, возможно, потребуется найти способ дополнить эти наборы данных, чтобы получить гораздо лучшие результаты.