Я на самом деле работаю над путями стационарных больных во время их пребывания в больнице.Эти пути представлены в виде последовательностей состояний (текущая медицинская единица на каждую единицу времени), и я пытаюсь найти типичные пути с помощью алгоритмов кластеризации.
Я создаю матрицу расстояний с помощью функции seqdist
изР пакет TraMineR
, по методике "OMspell"
.Я уже прочитал документацию R и соответствующие статьи, но не могу найти, как установить аргументы tpow
и expcost
.
Поскольку единица времени - час, я нехотите, чтобы какая-то небольшая разница в продолжительности оказала большое влияние на результат кластеризации (в отличие от передачи медицинского подразделения, например).Но я не хочу, чтобы длительность не оказала никакого влияния ...
Кроме того, есть ли правильный способ выбрать их значение?Или я просто продолжаю нащупывать хорошую конфигурацию?(Я использую критерии Dunn, Davies-Bouldin и Silhouette для сравнения результатов иерархической кластеризации, помимо медицинского заключения о полученных кластерах)