Question

Может ли кто-нибудь указать мне, как проверить шаблон, в котором под-шаблон встречается ноль или один раз?

Например,

Test 1-2 (many): blah blah
Test 1-2: blah blah

Обе линии должны быть обнаружены.

Я пытался с:

sub = 'Test\s+(\d+\s*\-\s*\d+)\s*\((.*?)\)?(\:*)\s*(.*)'

Но это не работает, как ожидалось.

jxc · Answer 1 · 24 мая 2019

Вы можете использовать следующее для соответствия подшаблону, который встречается ноль или один раз:

(?:sub_pattern)?

, где (?:...) - группа без захвата. В вашем конкретном примере знак вопроса (для совпадения с нулем или одним подшаблоном) установлен на \)?, это влияет только на одну предшествующую закрывающую скобку ')'. Вы должны поместить весь необязательный подшаблон в группу без захвата, таким образом:

(?:\(.*?\))?

Примечание: НЕ используйте группы захвата (...), если вы не хотите извлекать их значения отдельно.

Ниже приведен тестовый код для полного шаблона регулярного выражения:

import re

# a list of testing strings
x = ['Test 1-2 (many): blah blah', 'Test 1-2: blah blah', 'Test 1: no match']

# regex pattern
sub = r'Test\s+\d+\s*-\s*\d+\s*(?:\(.*?\))?:.+'  

for i in x:
    m = re.match(sub, i)
    if m: print(m.group(0)) 
#Test 1-2 (many): blah blah
#Test 1-2: blah blah

Emma · Answer 2 · 23 мая 2019

Здесь мы можем добавить необязательное подвыражение после :, затем собрать наше значение в группе захвата и собрать наши цифры и тире в другой, возможно, похожей на:

Test\s+([0-9-]+)(.+)?:\s+(.+)

Если мы хотим добавить больше границ, мы можем это сделать.Остальная часть нашей работы может быть запрограммирована.

ДЕМО

Тест

# coding=utf8
# the above tag defines encoding for this document and is for Python 2.x compatibility

import re

regex = r"Test\s+([0-9-]+)(.+?):\s+(.+)"

test_str = ("Test 1-2 (many): blah blah\n"
    "Test 1-2: blah blah")

matches = re.finditer(regex, test_str, re.MULTILINE)

for matchNum, match in enumerate(matches, start=1):

    print ("Match {matchNum} was found at {start}-{end}: {match}".format(matchNum = matchNum, start = match.start(), end = match.end(), match = match.group()))

    for groupNum in range(0, len(match.groups())):
        groupNum = groupNum + 1

        print ("Group {groupNum} found at {start}-{end}: {group}".format(groupNum = groupNum, start = match.start(groupNum), end = match.end(groupNum), group = match.group(groupNum)))

# Note: for Python 2.7 compatibility, use ur"" to prefix the regex and u"" to prefix the test string and substitution.

Демо

const regex = /Test\s+([0-9-]+)(.+)?:\s+(.+)/gm;
const str = `Test 1-2 (many): blah blah
Test 1-2: blah blah`;
let m;

while ((m = regex.exec(str)) !== null) {
    // This is necessary to avoid infinite loops with zero-width matches
    if (m.index === regex.lastIndex) {
        regex.lastIndex++;
    }
    
    // The result can be accessed through the `m`-variable.
    m.forEach((match, groupIndex) => {
        console.log(`Found match, group ${groupIndex}: ${match}`);
    });
}

Другой подход Кенан Гюлер

RegExp: ^(Test\s+\d+-\d+)\b(?:.*?:\s*)(.*)$

Демонстрация: https://repl.it/repls/LovableCaringBrowser

  import re

  base_sub_pattern = ["Test 1-2", "blah blah"]

  string = """\
  Test 1-2 (many): blah blah
  Test 1-2: blah blahGGG
  """

  pattern = re.compile(r"^(Test\s+\d+-\d+)\b(?:.*:\s*)(.*)$", re.MULTILINE)
  matches = pattern.findall(string)

  if matches:
    print("found matches:", matches, "\n")

    for match in matches:
      if set(base_sub_pattern).difference(match):
        print("sub-pattern not exist here", match)

Проверьте наличие нуля или одной подстроки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

ДЕМО

Тест

Демо

Другой подход Кенан Гюлер

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Проверьте наличие нуля или одной подстроки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

ДЕМО

Тест

Демо

Другой подход Кенан Гюлер

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов