Как ограничить последовательности, загруженные из NCBI, только опубликованными данными? - PullRequest
0 голосов
/ 14 июня 2019

Я хочу загрузить эталонные последовательности 28S из NCBI для таксономической идентификации моих данных. Я знаю, что мне нужно использовать «Entrez ESearch» для загрузки данных. Однако я не могу найти способ ограничить загружаемые данные последовательностями, которые были опубликованы в прошлом. Метаданные для последовательностей, которые я хочу исключить, имеют метку «Неопубликованные» в строке «Журнал». Я попробовал такую ​​команду, но она не сработала:

esearch -db nuccore -query "28S AND ulva [ORGN]" | efilter -query "NOT Unpublished [JOUR]" | efetch -format fasta

Вывод моей команды содержал неопубликованные последовательности. Окончательный вывод должен содержать только последовательности FASTA, которые были опубликованы в научных журналах в прошлом

...