Формат файла с самоописанием для гигапиксельных изображений? - PullRequest
7 голосов
/ 15 декабря 2009

В медицинской визуализации существует два способа хранения огромных гигапиксельных изображений:

  1. Используйте множество изображений JPEG (либо упакованных в файлы, либо по отдельности) и составьте какой-нибудь причудливый индексный формат, чтобы описать, что и где. Привязать некоторые метаданные в другом формате.

  2. Используйте поддержку TIFF для мозаики и нескольких изображений, чтобы аккуратно хранить изображения в виде одного файла и предоставлять уменьшенные версии для увеличения скорости. Затем злоупотребляйте различными тегами TIFF для хранения метаданных нестандартными способами. Кроме того, храните тайлы с перекрывающимися границами, которые должны быть переведены индивидуально позже.

В обоих случаях читатель должен понимать формат достаточно хорошо, чтобы понимать, как рисовать вещи и читать метаданные.

Есть ли лучший способ хранить эти изображения? Является ли TIFF (или BigTIFF ) правильным форматом для этого? XMP решает проблему метаданных?

Основные проблемы:

  • Хранение изображений таким образом, чтобы обеспечить быстрый произвольный доступ (тайлинг)
  • Хранение изображений с пониженной частотой для быстрого масштабирования (пирамида)
  • Обработка случаев, когда плитки перекрываются или разрежены (сканеры часто работают, перемещая камеру над слайдом в 2D и снимая только там, где есть что-то для изображения)
  • Хранение важных метаданных, включая связанные изображения, такие как ярлык слайда и миниатюра
  • Поддержка хранилища с потерями

Какие (надеюсь, непатентованные) форматы люди используют для хранения больших аэрофотоснимков или карт? Эти изображения имеют похожие свойства.

Ответы [ 6 ]

5 голосов
/ 31 декабря 2009

Похоже, что начинать с TIFF или BigTIFF и определять полезное подмножество тегов + метаданные XMP могут быть подходящим вариантом. FITS не годится, поскольку он в основном предназначен для данных без потерь и не имеет очень подходящего механизма метаданных.

Проблема с TIFF заключается в том, что он просто допускает слишком большую гибкость, но подмножество TIFF должно быть приемлемым.

Решение вполне может быть http://ome -xml.org / и http://ome -xml.org / wiki / OmeTiff .

Похоже, DICOM теперь имеет поддержку: FTP: //medical.nema.org/MEDICAL/Dicom/Final/sup145_ft.pdf

3 голосов
/ 15 декабря 2009

Вы, вероятно, хотите FITS .

  • Произвольный размер
  • 1--3 размерные данные
  • Обширный заголовок
  • Широко используется в астрономии и одобрен НАСА и МАС
2 голосов
/ 13 сентября 2013

Промышленный стандарт DICOM Sup 145 ; заставить продавцов принять его, хотя это было вяло, но изобретать еще один формат, вероятно, не было бы полезно.

2 голосов
/ 17 декабря 2009

Я патолог (и программист-любитель), поэтому мой интерес представляют виртуальные слайды и цифровая патология. Возможно, вас заинтересует проект OpenSlide . Они характеризуют ряд фирменных форматов от крупных поставщиков (Aperio, BioImagene и т. Д.). Большинство из них, по-видимому, состоят из пирамидального увеличенного изображения (отсканированного в разных микроскопических целях, конечно), больших файлов формата tiff, содержащих несколько плиточных изображений или сжатых (JPEG или JPEG2000) изображений.

1 голос
/ 09 января 2012

JPEG2000, возможно, стоит посмотреть, некоторые интересные усилия национальных библиотек в этом пространстве.

1 голос
/ 15 декабря 2009

PNG может работать на вас. Он может обрабатывать большие изображения, метаданные, а формат PNG может иметь чересстрочное , так что вы можете довольно легко получить (до?) N / 8 x n / 8 уменьшенного изображения.

Я не уверен, что PNG может делать быстрый произвольный доступ. Это куски, но этого может быть недостаточно.

Вы можете представлять разреженные данные с помощью канала прозрачности.

...