Пожалуйста, найдите пример моей строки:
<s id="1">Here we show that <ANAPH id="535" biotype="partof_product">the approximately 600-amino acid; region</ANAPH> something somethingelse .</s>
Необходимая функция - очистить строку, удалив заключенные в угловые скобки последовательности (включая угловые скобки).Таким образом, для моего примера строки выше желаемый результат будет:
Here we show that the approximately 600-amino acid; region something somethingelse .
Для регулярного выражения = \ <{1}. * \> {1} и при использовании функции replaceAll вся строка заменяется;Я понимаю, почему так происходит.Может ли кто-нибудь указать способ выразить шаблон более конкретно, используя регулярные выражения для получения желаемого результата?
Спасибо.
Edit1:
ДаПриведенная выше строка позаботилась об использовании регулярного выражения, предложенного Kassym Dorsel
Однако для приведенной ниже строки:
<s id="7"><ANAPH id="100216" biotype="supertype" assoc_ante="48275" assoc_rel="set-member" coref_chain="set_234">The C. elegans genome sequence</ANAPH> was completed two years ago [ 1 ] , and both the Drosophila [ 2 ] and human genomes are essentially completely sequenced at this point .</s>
Результат использования регулярного выражения:
<ANAPH id="100216" biotype="supertype" assoc_ante="48275" assoc_rel="set-member" coref_chain="set_234">The C. elegans genome sequence</ANAPH> was completed two years ago [ 1 ] , and both the Drosophila [ 2 ] and human genomes are essentially completely sequenced at this point .</s>
Желаемый вывод:
The C. elegans genome sequence was completed two years ago [ 1 ] , and both the Drosophila [ 2 ] and human genomes are essentially completely sequenced at this point .
Не могли бы вы помочь мне обобщить регулярное выражение?