У меня есть несколько сотен .txt
файлов в каталоге следующего формата:
<DOC>
<DOCNO> 33 </DOCNO>
<SOURCE> URL v.01 </SOURCE>
<URL> www.url.com/extension.html </URL>
<DATE> 2019/12/29/ </DATE>
<TIME> </TIME>
<AUTHOR> </AUTHOR>
<HEADLINE>
The title is here
</HEADLINE>
<TEXT>
Text that I want
</TEXT>
</DOC>
Я хотел бы манипулировать каждым отдельным файлом, чтобы файл содержал только текст между *Теги 1005 * и </TEXT>
(т.е. Text that I want
)
Я пробовал следующий код, но он, похоже, не выполняет то, что мне нужно:
find /root/Desktop/data/data -type f | xargs sed -n '/<TEXT/,/<\/TEXT/p'
Как я могу это сделатьиспользуя скрипт bash (желательно с использованием sed
)?