Получить данные из GenBank с помощью модуля Bio.Entrez - PullRequest
0 голосов
/ 13 февраля 2019

Я пытаюсь решить одну из задач Розалинды, и я не могу найти способ извлечь данные в течение определенного периода времени.

http://rosalind.info/problems/gbk/

Do /Как изменить Entrez.esearch (), чтобы указать временные рамки?

Question:

Given: имя рода, за которым следуют две даты в формате ГГГГ / М / Д.

Return: Количество записей нуклеотидного GenBank для данного рода, опубликованных между указанными датами.

Тестовые данные:

  • Anthoxanthum
  • 2003/7/25
  • 2005/12/27

Ответ: 7

1 Ответ

0 голосов
/ 14 февраля 2019

Большое спасибо @Kayvee за указатель!Это работает как очарование!

Вот формат для поиска в организме по 'размещенному между началом и концу':

(Anthoxanthum[Organism]) AND ("2003/7/25"[Publication Date] : "2005/12/27"[Publication Date])

Вот код Python:

# GenBank gene database
geneName = "Anthoxanthum"
pubDateStart = "2003/7/25"
pubDateEnd = "2005/12/27"
searchTerm = f'({geneName}[Organism]) AND("{pubDateStart}"[Publication Date]: "{pubDateEnd}"[Publication Date])'

print(f"\n[GenBank gene database]:")
Entrez.email = "please@pm.me"
handle = Entrez.esearch(db="nucleotide", term=searchTerm)
record = Entrez.read(handle)
print(record["Count"])
...