Скрипт для поиска папок для документов OCR PDF - PullRequest
0 голосов
/ 13 декабря 2011

Я написал скрипт для поиска в одной папке, чтобы сообщить мне, какие шрифты в PDF есть (быстрый способ узнать, был ли это OCR, если кто-то не знает лучшего)

Что я могуна мой сценарий для его поиска по всем папкам в основном DIR?

Есть мысли?

!/bin/bash
SAVEIFS=$IFS
IFS=$(echo -en "\n\b")
PDFDIR=/home/user/Temp/Docs/*.pdf
for f in $PDFDIR
do
echo "******************PDF***********************"
pdffonts $f
echo "$f"
echo "******************PDf***********************"
done > output.txt
# restore $IFS
IFS=$SAVEIFS 

Ответы [ 2 ]

2 голосов
/ 13 декабря 2011

Вам лучше использовать find:

find /home/usr/Temp/Docs -name \*.pdf -exec echo "***PDF***" -print -exec pdffonts {} \; -exec echo "***END PDF***" \;
0 голосов
/ 13 декабря 2011

изменить это:

PDFDIR=/home/user/Temp/Docs/*.pdf
for f in $PDFDIR

на это:

PDFDIR=/home/user/Temp/Docs
for f in $(find $PDFDIR -type f -name "*.pdf")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...