Использование Regex в .Net
У меня будет набор данных, который выглядит примерно так:
< Bunch o' Data Here >
, где <
- просто индикатор новой записи, а >
- это конец записи.
эти записи могут входить вот так
< Dataset 1><Dataset 2 broken, no closing tag <dataset 3>
они также могут приходить как
< Dataset 1>Dataset 2 broken, no opening tag ><dataset 3>
хотя, я 'Я не уверен, что этот последний случай возможен, и я перейду этот мост, когда мне придется.
Я пытаюсь использовать Regex, чтобы разделить их на записи на основе этого начального и конечного символов, в конечном итоге что-то вроде этого
Match 1 = < Dataset 1>
Match 2 = <Dataset 2 broken, no closing tag
Match 3 = <Dataset 3>
Я пытаюсь выяснить, какзахват групп работает, и, возможно, мое понимание неверно.
<.*?(?:<|>)
, я думаю, довольно близко подходит ко мне, за исключением того, что он включает в себя вводный символ 3-го набора данных и захват второй группы.Я также подозреваю, что ?:
не делает то, что ему нужно, и если он его вынимает, он возвращает тот же набор совпадений (2).