Регулярное выражение (повторяющийся шаблон границы) в Java - PullRequest
0 голосов
/ 09 февраля 2012

Пожалуйста, найдите пример моей строки:

<s id="1">Here we show that <ANAPH id="535" biotype="partof_product">the approximately 600-amino acid; region</ANAPH> something somethingelse .</s>

Необходимая функция - очистить строку, удалив заключенные в угловые скобки последовательности (включая угловые скобки).Таким образом, для моего примера строки выше желаемый результат будет:

Here we show that the approximately 600-amino acid; region something somethingelse .

Для регулярного выражения = \ <{1}. * \> {1} и при использовании функции replaceAll вся строка заменяется;Я понимаю, почему так происходит.Может ли кто-нибудь указать способ выразить шаблон более конкретно, используя регулярные выражения для получения желаемого результата?

Спасибо.


Edit1:

ДаПриведенная выше строка позаботилась об использовании регулярного выражения, предложенного Kassym Dorsel

Однако для приведенной ниже строки:

<s id="7"><ANAPH id="100216" biotype="supertype" assoc_ante="48275" assoc_rel="set-member" coref_chain="set_234">The C. elegans genome sequence</ANAPH> was completed two years ago [ 1 ] , and both the Drosophila [ 2 ] and human genomes are essentially completely sequenced at this point .</s>

Результат использования регулярного выражения:

<ANAPH id="100216" biotype="supertype" assoc_ante="48275" assoc_rel="set-member" coref_chain="set_234">The C. elegans genome sequence</ANAPH> was completed two years ago [ 1 ] , and both the Drosophila [ 2 ] and human genomes are essentially completely sequenced at this point .</s>

Желаемый вывод:

The C. elegans genome sequence was completed two years ago [ 1 ] , and both the Drosophila [ 2 ] and human genomes are essentially completely sequenced at this point .

Не могли бы вы помочь мне обобщить регулярное выражение?

1 Ответ

4 голосов
/ 09 февраля 2012

Учитывая это: <s id="1">Here we show that <ANAPH id="535" biotype="partof_product">the approximately 600-amino acid; region</ANAPH> something somethingelse .</s>

Использование этого <[^>]*?> и замена пустым дает это:

Here we show that the approximately 600-amino acid; region something somethingelse .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...