Я работаю с биологическими данными, а именно с группами генов.Например:
group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH
Для каждой пары генов, geneX
и geneY
У меня есть оценка, показывающая, насколько похожи эти два гена (на самом деле, у меня есть две оценки, так как я использовал BLAST, который«Направленный»: сначала я искал geneX
по всем остальным генам, а затем geneY
по всем остальным генам, поэтому у меня есть два geneX--geneY
балла, но я думаю, что могу взять более низкий балл из двух или среднее).
Итак, предположим, у меня есть только один балл для каждой пары генов.Мои данные могут быть просмотрены как неориентированный график:
и напомним, что к каждому ребру прикреплена оценка.
Теперь я хотел бы сделать следующее:
Визуализация моих данных в интерактивном режиме: возможность щелкать по генным узлам и открывать привязанную к ним ссылку, показывать только ребра выше / ниже некоторого порога, контролировать, как сеть «распространяется» и т. Д.
Кластер вместе группы , которые похожи, то есть группы, которые имеют сходные гены.
Любые идеи о том, как я могу это сделать?Я предполагаю, что это базовая кластеризация, и я был бы признателен за любые советы по пакетам / программному обеспечению, которые могут быть здесь полезны.
Спасибо.