Я пытаюсь извлечь строку из другого с помощью регулярных выражений.
Я использую функции регулярного выражения POSIX (regcomp, regexec
...), и мне не удается захватить группу ...
Например, пусть шаблон будет таким простым, как "MAIL FROM:<(.*)>"
(с REG_EXTENDED
флагами)
Я хочу захватить все между '<' и '>'
Моя проблема в том, что regmatch_t
дает мне границы всего шаблона (MAIL FROM: <...>) вместо того, что находится между скобками ...
Чего мне не хватает?
Заранее спасибо,
редактировать: некоторый код
#define SENDER_REGEX "MAIL FROM:<(.*)>"
int main(int ac, char **av)
{
regex_t regex;
int status;
regmatch_t pmatch[1];
if (regcomp(®ex, SENDER_REGEX, REG_ICASE|REG_EXTENDED) != 0)
printf("regcomp error\n");
status = regexec(®ex, av[1], 1, pmatch, 0);
regfree(®ex);
if (!status)
printf( "matched from %d (%c) to %d (%c)\n"
, pmatch[0].rm_so
, av[1][pmatch[0].rm_so]
, pmatch[0].rm_eo
, av[1][pmatch[0].rm_eo]
);
return (0);
}
выходы:
$./a.out "012345MAIL FROM:<abcd>$"
matched from 6 (M) to 22 ($)
Решение:
Как сказал RarrRarrRarr, индексы действительно находятся в pmatch[1].rm_so
и pmatch[1].rm_eo
следовательно regmatch_t pmatch[1];
становится regmatch_t pmatch[2];
и regexec(®ex, av[1], 1, pmatch, 0);
становится regexec(®ex, av[1], 2, pmatch, 0);
Спасибо:)