Я хочу загрузить эталонные последовательности 28S из NCBI для таксономической идентификации моих данных. Я знаю, что мне нужно использовать «Entrez ESearch» для загрузки данных. Однако я не могу найти способ ограничить загружаемые данные последовательностями, которые были опубликованы в прошлом. Метаданные для последовательностей, которые я хочу исключить, имеют метку «Неопубликованные» в строке «Журнал». Я попробовал такую команду, но она не сработала:
esearch -db nuccore -query "28S AND ulva [ORGN]" | efilter -query "NOT Unpublished [JOUR]" | efetch -format fasta
Вывод моей команды содержал неопубликованные последовательности. Окончательный вывод должен содержать только последовательности FASTA, которые были опубликованы в научных журналах в прошлом