Question

У меня есть следующие строки:

БЕЛК НИЗКОГО КАЧЕСТВА: 5-подобные цистеин протеиназы [Solanum pennellii]
ПРОГНОЗ: БЕЛК НИЗКОГО КАЧЕСТВА: нехарактеризованный белок LOC107059219 [Solanum pennellii]
XP_019244624.1 ПРОГНОЗИРУЕТСЯ: пероксидаза 40-подобная [Nicotiana аттенуата]
RVW92024.1 Ретровирусный полипротеин Pol из транспозона TNT 1-94 [Vitis vinifera]
гипотетическийпротеин VITISV_035070 [Vitis vinifera]

Как извлечь следующие строки из вышеуказанных строк?

цистеинпротеиназа 5-подобная
нехарактеризованный белок LOC107059219
пероксидаза 40-подобная
Ретровирусный полипротеин Pol из транспозона TNT 1-94
гипотетический белок VITISV_035070

Заранее спасибо,

Dev Khadka · Answer 1 · 20 сентября 2019

Я думаю, что эта проблема не нуждается в регулярных выражениях.Я бы предпочел следующее решение, потому что это легко понять

st = "PREDICTED: LOW QUALITY PROTEIN: uncharacterized protein LOC107059219 [Solanum pennellii]"
st.split(":")[-1].split("[")[0].strip()

ComplicatedPhenomenon · Answer 2 · 20 сентября 2019

s = '''LOW QUALITY PROTEIN: cysteine proteinase 5-like  [Solanum pennellii]
PREDICTED: LOW QUALITY PROTEIN: uncharacterized protein LOC107059219 [Solanum pennellii]
XP_019244624.1 PREDICTED: peroxidase 40-like [Nicotiana attenuata]
RVW92024.1 Retrovirus-related Pol polyprotein from transposon TNT 1-94 [Vitis vinifera]
hypothetical protein VITISV_035070 [Vitis vinifera]'''

import re
rgx = '(:?)\s([\w\s-]+)\s(\[.+\])'

list1 = []
for m in re.findall(rgx, s):
    list1.append(m[1])

print(list1)

Вывод

['cysteine proteinase 5-like ',
 'uncharacterized protein LOC107059219',
 'peroxidase 40-like',
 'Retrovirus-related Pol polyprotein from transposon TNT 1-94',
 'hypothetical protein VITISV_035070']

Найдите подробное объяснение https://regex101.com/r/HATKMa/1.

извлечение строк с использованием регулярного выражения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

извлечение строк с использованием регулярного выражения

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы