Я хочу проверить, есть ли в моем тексте другие слова. Эти слова в полном тексте. Но я не нахожу регулярное выражение для grep / pdfgrep с perl regex.
My text with foo with other text and
many many
other lines
in the same text
for bar and i don't know
Мое регулярное выражение для pdfgrep (аналогично grep)
pdfgrep -i -P "foo.*bar" mypdf.pdf
Это не работает , потому что слова находятся на разных строках. Я пробовал много других регулярных выражений как. *, Где я нашел для других регулярных выражений:
(?s).*
([\s\S]*)
(.*?)
и многих других. Предоставляет решение для grep / pdfgrep, чтобы найти это?
Я проверю, вставил ли мой pdf-файл все искомые слова
РЕДАКТИРОВАТЬ: Для меня теперь работает эта команда. Спасибо Пьеру Франсуа
# Find foo AND bar
pdftotext mypdf.pdf - | tr '\n' ' ' | grep -P 'foo.*?bar'
# Find foo OR bar
pdftotext mypdf.pdf - | tr '\n' ' ' | grep -P 'foo|bar'
# The same Commands but with pdfgrep
# Find foo AND bar
pdfgrep -i -P ".*" mypdf.pdf | tr '\n' ' ' | grep -P 'foo.*?bar'
# Find foo OR bar
pdfgrep -i -P ".*" mypdf.pdf | tr '\n' ' ' | grep -P 'foo|bar'
Coimmand с Sed работает, но только найти Foo ИЛИ бар, а не Foo И бар