Question

У меня есть строка в формате 'OBNAME [источник: 85 копия: 1 идентификатор: TDEP], OBNAME [источник: 85 копия: 1 идентификатор: RDEP]' и вывод должен быть TDEP, RDEP, что является эффективным способомэкстракт?

test = 'OBNAME[origin:85 copy:1 identifier:TDEP],OBNAME[origin:85 copy:1 identifier:RDEP]'
test1 = test.replace('OBNAME','')
test2 = test1.split(',')
for dd in test2 :
    #print(dd)
    test4 = dd.split('identifier:')
    test5 = test4[1]
    channels = channels +','+ test5.replace(']','')
print(channels)

Emma · Answer 1 · 07 июня 2019

Здесь мы можем использовать простое выражение с группой захвата и собирать желаемые результаты, а затем соединяем их запятой:

identifier:(\s+)?(.*?)(\s+)?\]

если пробел может быть нежелательным, в противном случае мы могли бы упростить его до:

identifier:(.*?)\]

Демо

Тест

# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility

import re

regex = r"identifier:(\s+)?(.*?)(\s+)?\]"

test_str = ("OBNAME[origin:85 copy:1 identifier:TDEP],OBNAME[origin:85 copy:1 identifier:RDEP]\n\n"
    "OBNAME[origin:85 copy:1 identifier: TDEP  ],OBNAME[origin:85 copy:1 identifier:  RDEP  ]")

matches = re.finditer(regex, test_str, re.MULTILINE)

for matchNum, match in enumerate(matches, start=1):

    print ("Match {matchNum} was found at {start}-{end}: {match}".format(matchNum = matchNum, start = match.start(), end = match.end(), match = match.group()))

    for groupNum in range(0, len(match.groups())):
        groupNum = groupNum + 1

        print ("Group {groupNum} found at {start}-{end}: {group}".format(groupNum = groupNum, start = match.start(groupNum), end = match.end(groupNum), group = match.group(groupNum)))

# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.

RegEx

Если это выражение не было желательным, и вы хотите изменить его, перейдите по этой ссылке на regex101.com .

RegEx Circuit

jex.im визуализирует регулярные выражения:

Luk · Answer 2 · 07 июня 2019

Вы можете использовать регулярное выражение: identifier:(.*?)]

Это код, сгенерированный на regex101.com:

https://regex101.com/r/t5ToQK/1

# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility

import re

regex = r"identifier:(.*?)]"

test_str = "'OBNAME[origin:85 copy:1 identifier:TDEP],OBNAME[origin:85 copy:1 identifier:RDEP]'"

matches = re.finditer(regex, test_str, re.MULTILINE)

for matchNum, match in enumerate(matches, start=1):

    print ("Match {matchNum} was found at {start}-{end}: {match}".format(matchNum = matchNum, start = match.start(), end = match.end(), match = match.group()))

    for groupNum in range(0, len(match.groups())):
        groupNum = groupNum + 1

        print ("Group {groupNum} found at {start}-{end}: {group}".format(groupNum = groupNum, start = match.start(groupNum), end = match.end(groupNum), group = match.group(groupNum)))

# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.

The fourth bird · Answer 3 · 07 июня 2019

Вы можете использовать одну группу захвата и класс отрицанных символов, чтобы не совпадать с ]:

\bidentifier:([^]]+)\]

Это будет соответствовать:

\bidentifer: Идентификатор совпадения: предваряется границей слова
( Группа захвата
- [^]]+ Соответствие 1+ раз не ]
)Закрыть группу захвата
\] Совпадение ]

Regex demo

Как извлечь конкретный текст из строки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Демо

Тест

RegEx

RegEx Circuit

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как извлечь конкретный текст из строки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Демо

Тест

RegEx

RegEx Circuit

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов