несоответствие регулярных выражений findstr - PullRequest
0 голосов
/ 14 мая 2011

Если я запускаю эту команду CLI:

pdftotext -l 10 file.pdf - | findstr /i /r "isbn[0-9 xX\-]*"

Я не получаю совпадения.

Если я выводю pdftotext xpdf в текстовый файл:

pdftotext -l 10 file.pdf file.txt

, затем проанализируйте этот файл в Кики, например, по той же схеме:

isbn[0-9 xX\-]*

Я получаю ожидаемые результаты.

Что здесь может быть не так?

PS stdout из pdftotext правильно читается findstr

1 Ответ

1 голос
/ 14 мая 2011

Вы пробовали некоторые примеры входных данных с echo isbn1-23-4 | findstr или подобным?

Мне кажется, что Windows findstr не понимает скобку [0-9 xX\-]. Однако, похоже, что echo isbn1-X23-4x | findstr /i /r "isbn[0123456789-xX]*" работает, так что вы можете добиться успеха с

pdftotext -l 10 file.pdf - | findstr /i /r "isbn[0123456789-xX]*"
...