вопрос для специального персонажа в parse dicom есть корейское имя пациента - PullRequest
0 голосов
/ 07 октября 2019

Я использую daikonjs (https://github.com/rii-mango/Daikon) для анализа файла dicom. Но у меня возникают проблемы с корейским, и имя пациента после возврата анализа включает некоторые специальные символы. Но когда я использовал приложение radiAnt или dicom4che, результат не имелспециальный символ. Реальность: � $) C 김귀순 Ожидаемый: 김귀순 Это файл dicom с корейским именем пациента: "https://github.com/rii-mango/Daikon/files/3696509/filenameHQ.zip"

1 Ответ

0 голосов
/ 07 октября 2019

Специфичный набор символов (0008 0005) определяет набор (ы) символов, используемые для кодирования строковых значений в наборе данных DICOM. В вашем случае он говорит:

(0008,0005) CS [\ISO 2022 IR 149]                       #  16, 2 SpecificCharacterSet

Это означает, что используются 2 набора символов:

  1. US ASCII (ISO_IR 6) - набор символов по умолчанию в DICOM,таким образом, явно не указано, но неявно первое значение атрибута (до обратной косой черты)

  2. корейский набор символов с использованием методов расширения кода (ISO 2022 IR 149).

Использование двух разных наборов символов требует использования методов расширения кода ISO 2022. Это работает путем добавления специальной последовательности символов, которая переключает набор символов - здесь: $)

По-видимому, Daikonjs (никогда не слышал об этом раньше) не поддерживает методы расширения кода, поэтому не распознает переключение набора символов.

РЕДАКТИРОВАТЬ: Кстати, я надеюсь, что вы анонимизировали набор данных. Похоже, реальная информация о пациенте, больнице и докторе все еще присутствует в нем. Это нарушает законодательство о конфиденциальности в большинстве стран мира (хотя не уверен насчет Кореи).

...