У меня есть табличный файл, который выглядит следующим образом:
query_name KEGG_KOs
PROKKA_00013 NaN
PROKKA_00015 bactNOG[38]
PROKKA_00017 NA|NA|NA
PROKKA_00019 K00240
PROKKA_00020 K00246
PROKKA_00022 K02887
Я пытаюсь создать сценарий для просмотра и удаления всей строки, если столбец 2 ('KEGG_KOs') не начинается с'K0'.Я пытаюсь создать вывод:
query_name KEGG_KOs
PROKKA_00019 K00240
PROKKA_00020 K00246
PROKKA_00022 K02887
В предыдущих ответах люди ссылались на pandas DataFrame, но мне не повезло, используя эти ответы, чтобы помочь.Любой был бы очень признателен, ура.
Я пытался (но это только изолирует определенную линию K0.
df = pd.read_csv("eggnog.txt", delimiter="\t", names=["#query_name", "KEGG_KOs"])
print(df.loc[df['KEGG_KOs'] == 'K00240'])