Apache cTakes - подключение к UMLS и внутренняя работа - PullRequest
0 голосов
/ 27 января 2020

Я изучаю Apache cTakes и у меня есть несколько вопросов-

1) Где cTakes хранит свои данные для классификации информации? Пример: «Печень» относится к анатомии. Я хотел бы знать, где хранится эта информация. Это в базе данных H SQL? Будут ли регулярно публиковаться обновленные версии этой базы данных?

2) Для информации о кодировании (SNOMED_CT или RxNorm или UMLS) cTakes вызывает API-интерфейсы UMLS во время выполнения? Мое первоначальное понимание было так, потому что в документации указано, что мне нужно включить учетную запись и пароль UMLS в приложение cTakes. Однако я вижу базу данных UMLS H SQL, которая заставляет меня думать, что информация о кодировании UMLS хранится в этой локальной базе данных H SQL, а UMLS API не вызывается во время выполнения. Может кто-нибудь уточнить, как cTakes получает информацию о кодировании из UMLS? Я загрузил словарь UMLS из Apache и включил его в состав объектов кода приложения cTakes.

...