Phylo BioPython строительные деревья - PullRequest
6 голосов
/ 29 октября 2010

Я пытаюсь построить дерево с помощью модуля BioPython, Phylo.
То, что я сделал до сих пор, это изображение: alt text

каждое имя имеет четырехзначный номер, за которым следует - и номер: этот номер относится к числу раз, которое представлена ​​последовательность. Это означает, что 1578 - 22, этот узел должен представлять 22 последовательности.

файл с выровненными последовательностями: файл
файл с расстоянием для построения дерева: файл

Так что теперь я знаю, как изменить каждый размер узла. Каждый узел имеет свой размер, это легко сделать массивом различных значений:

    fh = open(MEDIA_ROOT + "groupsnp.txt")    
    list_size = {}
    for line in fh:
        if '>' in line:
            labels = line.split('>')
            label = labels[-1]
            label = label.split()
            num = line.split('-')
            size = num[-1]
            size = size.split()
            for lab in label:
                for number in size:
                    list_size[lab] = int(number)

    a = array(list_size.values())

Но массив произвольный, я хотел бы поместить правильный размер узла в правильный узел, я попробовал это:

         for elem in list_size.keys():
             if labels == elem:
                 Phylo.draw_graphviz(tree_xml, prog="neato", node_size=a)

но при использовании оператора if ничего не появляется.

В любом случае делать это?

Буду очень признателен!

Спасибо всем

1 Ответ

8 голосов
/ 02 ноября 2010

Я, наконец, получил это работает.Основная предпосылка заключается в том, что вы собираетесь использовать labels/nodelist для создания node_sizes.Таким образом, они соотносятся правильно.Я уверен, что мне не хватает некоторых важных параметров, чтобы дерево выглядело на 100%, но кажется, что размеры узлов отображаются правильно.

#basically a stripped down rewrite of Phylo.draw_graphviz
import networkx, pylab
from Bio import Phylo


#taken from draw_graphviz
def get_label_mapping(G, selection): 
    for node in G.nodes(): 
        if (selection is None) or (node in selection): 
            try: 
                label = str(node) 
                if label not in (None, node.__class__.__name__): 
                    yield (node, label) 
            except (LookupError, AttributeError, ValueError): 
                pass


kwargs={}
tree = Phylo.read('tree.dnd', 'newick')
G = Phylo.to_networkx(tree)
Gi = networkx.convert_node_labels_to_integers(G, discard_old_labels=False)

node_sizes = []
labels = dict(get_label_mapping(G, None))
kwargs['nodelist'] = labels.keys()

#create our node sizes based on our labels because the labels are used for the node_list
#this way they should be correct
for label in labels.keys():
    if str(label) != "Clade":
        num = label.name.split('-')
        #the times 50 is just a guess on what would look best
        size = int(num[-1]) * 50
        node_sizes.append(size)

kwargs['node_size'] = node_sizes
posi = networkx.pygraphviz_layout(Gi, 'neato', args='') 
posn = dict((n, posi[Gi.node_labels[n]]) for n in G) 

networkx.draw(G, posn, labels=labels, node_color='#c0deff', **kwargs)

pylab.show()

Результирующее дерево alt text

...