Как построить график распределения частот с использованием seaborn в python / pandas для двудольных текстовых графических данных - PullRequest
0 голосов
/ 08 марта 2020

У меня есть фрейм данных с 70k строками, и это выглядит так:

mirna   gene_id
osa-miR2873a    Os01g0100100
osa-miR169d Os01g0100100
osa-miR169a Os01g0100100
osa-miR396a-3p  Os01g0100200
osa-miR396b-3p  Os01g0100200
...             ...

Я использую matplotlib & seaborn для построения графиков данных. & Мне удалось вычислить частоту, используя функцию value_counts() pandas.

Мне нужно построить график, чтобы показать, сколько раз в наборе данных появляется определенный диапазон частот «мирных» событий. Например, сколько 'mirna' имеет 1-5 пар mirna-gene_id, или 5-15 пар, или 15-30 пар и так далее ...

Таким образом, по сути, график должен показать, что (1-5 ) пары встречаются x раз, (5-15) пары встречаются y раз и т. д. c. Если я могу отобразить значения в отсортированном порядке, тем лучше. Я пробовал sns.distplot (), но он не работает для меня.

Есть какие-нибудь подсказки? Спасибо.

1 Ответ

0 голосов
/ 08 марта 2020

Вы можете сгруппировать по всему миру и суммировать по количеству gene_id. Тогда вы можете просто сделать гистограмму этого.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...