Регулярное выражение для разделенной строки, разделенной табуляцией - PullRequest
0 голосов
/ 22 марта 2019

У меня есть файл, содержащий много строк следующего

строка 123456 89 2018-02-12 14:47:07 +0000 здесь линия 234567 90 2019-02-13 09:02:01 +0000 там

Итак, я хотел бы разбить их на последние четыре части из каждой строки

Вот регулярное выражение, "\ Т \ д {6} \ т \ д {2} \ т \ W +"

выдает

123456 \ Т89 \ t2018 234567 \ t90 \ t2019

Как обновить регулярное выражение, чтобы получить

123456 \ t89 \ t2018-02-12 14: 47: 07 \ там 234567 \ t90 \ t2019-02-13 09: 02: 01 \ tthere

вместо

Спасибо!

1 Ответ

0 голосов
/ 22 марта 2019

Конец вашего регулярного выражения "\t\d{6}\t\d{2}\t\w+" соответствует следующему не состоящему из символов символу, который является чертой после элемента года.Чтобы захватить оставшиеся символы, я бы порекомендовал класс отрицательных символов, который соответствует всем, кроме \t.То есть:

"\t\d{6}\t\d{2}\t[^\t]+\t\w+"

Обычно это проще, чем указывать все возможные символы, которые могут произойти.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...