Question

В основном я хочу разобрать записи журнала в следующем формате:

a1 b2 c3) @ in # (d4 e5 f6) @ out # (g7 h8 i9

)@in#( - это первый разделитель между двумя предыдущими подстроками (a1 b2 c3 и d4 e5 f6).
)@out#( является необязательным разделителем для g7 h8 i9.
Существует один или два пробела вокруг разделителя.

Интересно, что оба разделителя содержат несколько символов.

Я хочу использовать get все подстроки, используя Bash регулярное выражение . Это мой текущий код:

s1='a1 b2 c3 )@in#( d4 e5 f6 )@out#( g7 h8 i9'
s2='a1 b2 c3 )@in#( d4 e5 f6'

regex='^(.*)[[:space:]]+\)@in#\([[:space:]]+(.*)[[:space:]]+\)@out#\([[:space:]](.*)$'

[[ $s =~ $regex ]] && printf '%s\n%s\n%s\n%s\n' "${BASH_REMATCH[1]}" "${BASH_REMATCH[2]}" "${BASH_REMATCH[3]}

Код соответствует только s1, но не s2Вот почему я пишу этот пост для вашей помощи.

Кстати, кто-нибудь может немного уточнить разницу между [[:space:]] и \s.

Обновление: изкомментарии и ответы, приведенные ниже, возможно, здесь не подходит регулярное выражение Bash. awk лучше, чем.

Вместо того, чтобы просто печатать вывод,Я хочу записать их в переменные или read в массив для дальнейшего процесса.

Zachary · Answer 1 · 18 января 2019

Мое окончательное решение заключается в следующем:

IFS=$'\n' _log_array=( $( awk -F'[[:space:]]*\\)@(in|out)#\\([[:space:]]*' '{ print NF; for (i = 1; i <= NF; ++i) print $i; }' <<< $s ) )

Установите IFS на \n.
Вместо печати на stdout , я назначаю вывод для массива .
Обратите внимание на дополнительные скобки снаружи.

Вот две ссылки:

stack0114106 · Answer 2 · 17 января 2019

Вы можете попробовать Perl

$ echo "a1 b2 c3 )@in#( d4 e5 f6 )@out#( g7 h8 i9" | perl -lne ' @a=split(/\s*\)\@in#\(\s*|\s*\)\@out#\(\s*/); print join("\n",@a) '
a1 b2 c3
d4 e5 f6
g7 h8 i9

$ echo "a1 b2 c3 )@in#( d4 e5 f6 g7 h8 i9" | perl -lne ' @a=split(/\s*\)\@in#\(\s*|\s*\)\@out#\(\s*/); print join("\n",@a) '
a1 b2 c3
d4 e5 f6 g7 h8 i9

$

Вы можете прочитать вывод, пройдя через цикл while

$ echo "a1 b2 c3 )@in#( d4 e5 f6 g7 h8 i9" | perl -lne ' @a=split(/\s*\)\@in#\(\s*|\s*\)\@out#\(\s*/); print join("\n",@a) ' | while read x;do; echo "val=$x"; done
val=a1 b2 c3
val=d4 e5 f6 g7 h8 i9
$

или выведите каждое значение arr в perl и прочитайте их один за другим

$ echo "a1 b2 c3 )@in#( d4 e5 f6 g7 h8 i9" | perl -lne ' @a=split(/\s*\)\@in#\(\s*|\s*\)\@out#\(\s*/); print $a[0] ' | read x1
$ echo $x1
a1 b2 c3
$

$ echo "a1 b2 c3 )@in#( d4 e5 f6 g7 h8 i9" | perl -lne ' @a=split(/\s*\)\@in#\(\s*|\s*\)\@out#\(\s*/); print $a[1] ' | read x2
$ echo $x2
d4 e5 f6 g7 h8 i9
$

bash регулярное выражение сопоставляет необязательную подстроку с разделителями группы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

bash регулярное выражение сопоставляет необязательную подстроку с разделителями группы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов