Как визуализировать генные сети и кластерные группы генов? - PullRequest
0 голосов
/ 13 сентября 2010

Я работаю с биологическими данными, а именно с группами генов.Например:

group 1: geneA geneB geneC
group 2: geneD geneE
group 3: geneF geneG geneH

Для каждой пары генов, geneX и geneY У меня есть оценка, показывающая, насколько похожи эти два гена (на самом деле, у меня есть две оценки, так как я использовал BLAST, который«Направленный»: сначала я искал geneX по всем остальным генам, а затем geneY по всем остальным генам, поэтому у меня есть два geneX--geneY балла, но я думаю, что могу взять более низкий балл из двух или среднее).

Итак, предположим, у меня есть только один балл для каждой пары генов.Мои данные могут быть просмотрены как неориентированный график: alt text

и напомним, что к каждому ребру прикреплена оценка.

Теперь я хотел бы сделать следующее:

  1. Визуализация моих данных в интерактивном режиме: возможность щелкать по генным узлам и открывать привязанную к ним ссылку, показывать только ребра выше / ниже некоторого порога, контролировать, как сеть «распространяется» и т. Д.

  2. Кластер вместе группы , которые похожи, то есть группы, которые имеют сходные гены.

Любые идеи о том, как я могу это сделать?Я предполагаю, что это базовая кластеризация, и я был бы признателен за любые советы по пакетам / программному обеспечению, которые могут быть здесь полезны.

Спасибо.

Ответы [ 2 ]

1 голос
/ 13 сентября 2010

Вы, вероятно, получите лучшие ответы, если спросите об этом на BioStar , обмен стека биоинформатики.В частности, многие ответы в этой теме могут быть актуальны:

Какое программное обеспечение является лучшим для представления биологических путей в ориентированном графе (сети)?

0 голосов
/ 13 сентября 2010

Вы можете попробовать cluto . Вам нужно будет преобразовать ваши тройки (gene_1, gene_2, Similarity) в матрицу и использовать 'scluster'.

...