notepad ++ удалить все (все символы и строки) перед совпадением с регулярным выражением - PullRequest
0 голосов
/ 06 февраля 2020

поэтому у меня есть текстовый файл следующим образом:

   stypiso6    iso6msdh   (freeUSP by CodeShop   ,sidx         è  N          ³  '      hmoof   mfhd          Ptraf   tfhd           tfdt         N     trun        p  '  C€ @  Kmdat<?xml version="1.0" encoding="utf-8"?><tt xmlns="http://www.w3.org/ns/ttml" xmlns:ttm="http://www.w3.org/ns/ttml#metadata" xmlns:ttp="http://www.w3.org/ns/ttml#parameter" xmlns:tts="http://www.w3.org/ns/ttml#styling" xml:lang="fr"><head><metadata><ttm:title>221968594-5e30a8b903d31</ttm:title><ttm:desc></ttm:desc><ttm:copyright></ttm:copyright></metadata><styling><style xml:id="captionStyle" tts:backgroundColor="transparent" tts:displayAlign="center" tts:extent="100% 20%" tts:fontFamily="proportionalSansSerif" tts:fontSize="30px" tts:origin="0% 75%" tts:textAlign="center" tts:textOutline="black 1px 0px" /></styling><layout><region style="captionStyle" xml:id="region2" /></layout></head><body><div region="region2"><p begin="00:00:24.366" end="00:00:28.500" region="region2" xml:id="caption4" ttm:role="caption">
        <span tts:textAlign="center" tts:color="white">Le suicide de Christine Renon,</span>
        <br></br>
        <span tts:textAlign="center" tts:color="white">directrice d&apos;école à Pantin,</span>
      </p><p begin="00:00:28.766" end="00:00:31.533" region="region2" xml:id="caption5" ttm:role="caption">
        <span tts:textAlign="center" tts:color="white">dans son école,</span>
        <br></br>
        <span tts:textAlign="center" tts:color="white">le 23 septembre 2019,</span>
      </p></div></body></tt>

Я хочу иметь возможность удалить все и все строки, которые предшествуют этой строке:

<?xml version="1.0" encoding="utf-8"?> 

в некоторых из Файлы, эта строка не происходит в первой строке. например, следующий файл:

   stypiso6    iso6msdh   (freeUSP by CodeShop   ,sidx         è 
»          w  '      hmoof   mfhd       [   Ptraf   tfhd           tfdt        
»     trun        p  '  € @  mdat<?xml version="1.0" encoding="utf-8"?><tt xmlns="http://www.w3.org/ns/ttml" xmlns:ttm="http://www.w3.org/ns/ttml#metadata" xmlns:ttp="http://www.w3.org/ns/ttml#parameter" xmlns:tts="http://www.w3.org/ns/ttml#styling" xml:lang="fr"><head><metadata><ttm:title>221968594-5e30a8b903d31</ttm:title><ttm:desc></ttm:desc><ttm:copyright></ttm:copyright></metadata><styling><style xml:id="captionStyle" tts:backgroundColor="transparent" tts:displayAlign="center" tts:extent="100% 20%" tts:fontFamily="proportionalSansSerif" tts:fontSize="30px" tts:origin="0% 75%" tts:textAlign="center" tts:textOutline="black 1px 0px" /></styling><layout><region style="captionStyle" xml:id="region2" /></layout></head><body><div region="region2"><p begin="00:15:01.700" end="00:15:04.466" region="region2" xml:id="caption217" ttm:role="caption">
        <span tts:textAlign="center" tts:color="Cyan">Un projet initié par Denis,</span>
        <br></br>
        <span tts:textAlign="center" tts:color="Cyan">juste retraité,</span>
      </p><p begin="00:15:04.733" end="00:15:07.633" region="region2" xml:id="caption218" ttm:role="caption">
        <span tts:textAlign="center" tts:color="Cyan">pas prêt de renoncer à sa vocation</span>
        <br></br>
        <span tts:textAlign="center" tts:color="Cyan">d&apos;enseignant.</span>
      </p><p begin="00:15:08.066" end="00:15:10.466" region="region2" xml:id="caption219" ttm:role="caption">
        <span tts:textAlign="center" tts:color="white">-Ici, on est sur la voûte.</span>
      </p></div></body></tt>

Я также хочу, чтобы каждая строка и символ перед совпадением строки были удалены со вторым шаблоном, чтобы они оба могли выглядеть примерно так:

<?xml version="1.0" encoding="utf-8"?><tt xmlns="http://www.w3.org/ns/ttml" xmlns:ttm="http://www.w3.org/ns/ttml#metadata" xmlns:ttp="http://www.w3.org/ns/ttml#parameter" xmlns:tts="http://www.w3.org/ns/ttml#styling" xml:lang="fr"><head><metadata><ttm:title>221968594-5e30a8b903d31</ttm:title><ttm:desc></ttm:desc><ttm:copyright></ttm:copyright></metadata><styling><style xml:id="captionStyle" tts:backgroundColor="transparent" tts:displayAlign="center" tts:extent="100% 20%" tts:fontFamily="proportionalSansSerif" tts:fontSize="30px" tts:origin="0% 75%" tts:textAlign="center" tts:textOutline="black 1px 0px" /></styling><layout><region style="captionStyle" xml:id="region2" /></layout></head><body><div region="region2"><p begin="00:00:24.366" end="00:00:28.500" region="region2" xml:id="caption4" ttm:role="caption">
        <span tts:textAlign="center" tts:color="white">Le suicide de Christine Renon,</span>
        <br></br>
        <span tts:textAlign="center" tts:color="white">directrice d&apos;école à Pantin,</span>
      </p><p begin="00:00:28.766" end="00:00:31.533" region="region2" xml:id="caption5" ttm:role="caption">
        <span tts:textAlign="center" tts:color="white">dans son école,</span>
        <br></br>
        <span tts:textAlign="center" tts:color="white">le 23 septembre 2019,</span>
      </p></div></body></tt>

1 Ответ

0 голосов
/ 06 февраля 2020
  • Ctrl + H
  • Найти что: \A.*(?=<\?xml version="1.0" encoding="utf-8"\?>)
  • Заменить на: LEAVE EMPTY
  • ПРОВЕРКА Матч
  • ПРОВЕРКА Обтекание
  • ПРОВЕРКА Регулярное выражение
  • CHECK . matches newline
  • Заменить все

Пояснение:

\A      # beginning of file
.*      # 0 or more any character
(?=<\?xml version="1.0" encoding="utf-8"\?>)
        # positive lookahead, make sure we have <?xml...... after

Снимок экрана (до):

enter image description here

Снимок экрана (после):

enter image description here

...