BASH: импорт данных из плоского файла в шаблон - PullRequest
3 голосов
/ 07 января 2012

У меня плоский файл записей, каждый длиной 33 строки.Мне нужно отформатировать этот файл для спецификации в шаблоне.Шаблон в формате DOS, а исходный файл в формате NIX.Шаблон имеет определенные отступы и интервалы, которые должны соблюдаться.Я подумал о нескольких вариантах:

  • BASH с классическими инструментами nix: sed, awk, grep и т. Д. *
  • BASH с набором шаблонов
  • Perleith template toolkit
  • Perl

Это в порядке моего знакомства.Вот пример исходной записи (в формате NIX): я сократил количество строк для экономии места (обычно 33 строки):

JACKSON HOLE SANITARIUM AND REPTILE ZOO
45 GREASY HOLLER LN
JACKSON HOLE, AK   99999


Change Service Requested


BUBBA HOTEP
3 DELIVERANCE RD
MINNEAPOLIS, MN   99998


BUBBA HOTEP 09090909090909

You have a hold available for pickup as of 2012-01-04:

Title: Banjo for Fun and Profit
Author: Williams, Billy Dee
Price: $10 

Вот шаблон (формат DOS - строки уменьшены - обычно 66 строк)):

     <%BRANCH-NAME%>
     <%BRANCH-ADDR%>
     <%BRANCH-CTY%>


<%CUST-NAME%> <%BARCODE%>
You have a hold available for pickup as of <%DATE%>:

Title: <%TITLE%>
Author: <%AUTHOR%>
Price: <%PRICE%>


             <%CUST-NAME%>
             <%CUST-ADDR%>
             <%CUST-CTY%>

end of file

На самом деле в конце каждой записи написано «конец файла».

Мысли?Я склонен слишком усложнять вещи.

ОБНОВЛЕНИЕ2

Разобрался.

Мой ответ ниже.Не стесняйтесь предлагать улучшения.

Ответы [ 2 ]

1 голос
/ 07 января 2012

Для начала вот подсказка: Perl HERE-документы (в качестве демонстрации показаны только несколько подстановок):

#!/usr/bin/perl
use strict;
use warnings;

my @lines = qw/branchname cust_name barcode bogus whatever/; # (<>);

my ($branchname, $cust_name, $barcode, undef, $whatever) = @lines;

print <<TEMPLATE;
     $branchname
     <%BRANCH-ADDR%>
     <%BRANCH-CTY%>


$cust_name $barcode
You have a hold available for pickup as of <%DATE%>:

Title: <%TITLE%>
Author: <%AUTHOR%>
Price: <%PRICE%>


             $cust_name
             <%CUST-ADDR%>
             <%CUST-CTY%>

end of file
TEMPLATE

Замените фиктивный входной массив строками, считанными из стандартного ввода, на (<>), если хотите. (Используйте цикл чтения n строк и поместите его в массив, если это более эффективно). Я только что показал суть, добавив больше переменных по мере необходимости, и пропустив строки ввода, указав undef для переменной 'capture' (как показано).

Теперь просто вставьте эти переменные в ваш текст.

Если конец строки вызывает у вас горе, рассмотрите возможность использования chomp например ::

my @lines = (<>); # just read em all...
my @cleaned = map { chomp } @lines;
0 голосов
/ 11 января 2012

Это то, что я использую для этого проекта. Не стесняйтесь предлагать улучшения или представлять лучшие решения.

cp $FILE $WORKING # we won't mess with original

NUM_RECORDS=$( grep "^Price:" "$FILE" | wc -l ) # need to know how many records we have 
                                              # counting occurences of end of record r

TMP=record.txt # holds single record, used as temp storage in loop below

# Sanity
# Make sure temp storage exists. If not create -- if so, clear it.
[ ! -f $TMP ] && touch $TMP || cat /dev/null >$TMP

# functions
function make_template () {
    local _file="$1"
    mapfile -t filecontent < "$_file"
    _loc_name="${filecontent[0]}"
    _loc_strt="${filecontent[1]}"
    _loc_city="${filecontent[2]}"
    _pat_name="${filecontent[14]}"
    _pat_addr="${filecontent[15]}"
    _pat_city="${filecontent[16]}"
    _barcode=${filecontent[27]:(-14)} # pull barcode from end of string
    _date=${filecontent[29]:(-11)}    # pull date from end of string
    # Test title length - truncate if necessary - 70 chars.
    _title=$(grep -E "^Title:" $_file)
    MAXLEN=70
    [ "${#_title}" -gt "$MAXLEN" ] && _title="${filecontent[31]:0:70}" || :
    _auth=$(grep -E "^Author:" $_file)
    _price=$(grep -E "^Price:" $_file)
    sed "
        s@<%BRANCH-NAME%>@${_loc_name}@g
        s@<%BRANCH-ADDR%>@${_loc_strt}@g
        s@<%BRANCH-CTY%>@${_loc_city}@g
        s@<%CUST-NAME%>@${_pat_name}@g
        s@<%CUST-ADDR%>@${_pat_addr}@
        s@<%CUST-CTY%>@${_pat_city}@
        s@<%BARCODE%>@${_barcode}@g
        s@<%DATE%>@${_date}@
        s@<%TITLE%>@${_title}@
        s@<%AUTHOR%>@${_auth}@
        s@<%PRICE%>@${_price}@" "$TEMPLATE"
}

####################################
#  MAIN
####################################

for((i=1;i<="$NUM_RECORDS";i++))
do
    sed -n '1,/^Price:/{p;}' "$WORKING" >"$TMP"  # copy first record with end of record
                                                # and copy to temp storage.

    sed -i '1,/^Price:/d' "$WORKING"             # delete first record using EOR regex.
    make_template "$TMP"                        # send temp file/record to template fu
done

# cleanup
exit 0
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...