Python представление смоделированной базовой последовательности с pandas - PullRequest
1 голос
/ 20 июня 2020

введите здесь описание изображения Я уже писал функцию для моделирования случайной последовательности, состоящей из четырех оснований A, C, G, T, длиной 10 ^ 1, 10 ^ 2 , 10 ^ 3, 10 ^ 4 или 10 ^ 5. Вероятность для каждой базы 0,25. Я написал другую функцию, которая вычисляет относительное количество каждой базы в заданной последовательности. Теперь я хочу проиллюстрировать на гистограмме относительное количество каждой базы (A, C, G, T) для каждой длины (10 ^ 1, 10 ^ 2, 10 ^ 3, 10 ^ 4, 10 ^ 5). для случайной последовательности, но я не совсем уверен, как это сделать. Моя первая мысль - написать фрейм данных pandas, но я немного не понимаю, как включить в него свои уже написанные функции. Может, ты мне поможешь.

1 Ответ

0 голосов
/ 20 июня 2020

Если я правильно понял, вы хотели сделать что-то вроде этого:

pd.concat([
    pd.Series(
        np.random.choice(list('ATCG'), 10**a), 
        name='10^{}'.format(a)).value_counts(normalize=True) for a in range(2,5)],
    axis=1, sort=True).T.plot(kind='bar')

plt.ylabel('normalised counts')
plt.xlabel('sequence length')

введите описание изображения здесь

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...