Question

У меня есть строка: Data="a" Chain="Y" Classification="" Coreentity="N" createdAt="2018-05-05" name="DM_KING" Hour="23" Sub="N" Я хочу извлечь DM_KING

Я не знаю, как сопоставить первое вхождение " после последнего ", что после nameЯ написал код регулярного выражения следующим образом:

Data=.*name=\"

Я ожидаю, что код вернется DM_KING, DM_KING может иметь любую длину

Johnsyweb · Answer 1 · 28 декабря 2018

Если вы хотите получить больше значений из входной строки, это было бы отличным местом для использования именованной группы :

import re
data = 'Data="a" Chain="Y" Classification="" Coreentity="N" createdAt="2018-05-05" name="DM_KING" Hour="23" Sub="N"'
matcher = re.compile('name="(?P<name>[^"]+)"')
match = matcher.search(data)
print(match.group('name'))

. Это печатает:

DM_KING

Объяснение :

name=" соответствует символам name=" буквально (с учетом регистра)
Именованная группа захвата "name" (?P<name>[^"]+)
Соответствует одному символу , а не (^), представленному в списке ["]
+ Квантор - соответствует от одного до неограниченного временистолько раз, сколько возможно, возвращая по мере необходимости (жадный)
" соответствует символу " буквально

Pushpesh Kumar Rajwanshi · Answer 2 · 28 декабря 2018

Вы можете использовать это регулярное выражение name="([^"]+)"

Это регулярное выражение ищет name=", затем группирует все найденное после этого, кроме ", и прекращает захват после того, как оно видит ".Затем вы можете распечатать все, что было захвачено в группе 1.

Код Python,

import re

str = 'Data="a" Chain="Y" Classification="" Coreentity="N" createdAt="2018-05-05" name="DM_KING" Hour="23" Sub="N"'
name = re.search(r'name="([^"]+)"', str)
print(name.group(1))

Печать,

DM_KING

MWayush · Answer 3 · 28 декабря 2018

print a[a.index('"',a.index('name="'))+1 :a.index('"',a.index('name="')+6)]

str.index (sub [, start [, end]]) возвращает индекс подстроки «sub» от позиции «start» до «end» в строке «str»

csharpcoder · Answer 4 · 28 декабря 2018

Если ваш До и после строки определен, т.е. Час, появляющийся после имени, Это должно работать как талисман для любой длины имени:

regex = r"name=\"(.*)\" Ho"

vks · Answer 5 · 28 декабря 2018

Data=.*name=\"([^"]*)

Вы можете использовать это с re.findall. См. Демонстрацию.

https://regex101.com/r/HrvZYo/1

meW · Answer 6 · 28 декабря 2018

Я считаю, что это должно работать:

re.search('name="\w+', s)[0].split("\"")[1]

Как получить первый матч регулярного выражения в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить первый матч регулярного выражения в Python

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов