Если бы вы посмотрели на страницу http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=9606&aa=1&style=N
, вы бы заметили, что она содержит не только нужную вам последовательность кодонов, но много из HTML вокруг нее. Чтобы извлечь только кодоны, лучше всего использовать BeautifulSoup:
from bs4 import BeautifulSoup
link = "http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=9606&aa=1&style=N"
f = urllib.request.urlopen(link)
myfile = f.read()
s = myfile.decode()
codons = BeautifulSoup(s).find('pre').text
Теперь вам, вероятно, следует обработать эту строку дальше, чтобы получить желаемую форму - dict, list, dataframe, что угодно. Предполагая, что вы просто хотите диктовать, так как вы упомянули словарь:
import re
codons_dict = { t[0]: t[1] for t in sorted(re.findall(r'(\w{3})\s+\w\s+(\S+)\s+\S+\s+[(]\d+[)]', codons)) }