Apache Camel Splitter EIP группы по - PullRequest
0 голосов
/ 17 мая 2018

У меня есть задача с файлами CSV.Мне нужно ограничить размер CSV, потому что внутренний механизм имеет ограничения по размерам полезной нагрузки.

Проблема заключается в извлечении заголовка, первой записи / строки, сохранении его и добавлении обратно к оставшимся разделенным данным, создавая таким образом несколько файлов с одинаковым заголовком.Я надеялся найти изящный способ справиться с этим.то, что у меня работает, но это хорошо, меньше, чем желательно кодирование.

Кроме того, мне нужно, чтобы группа By parm была программируемой, сейчас я пытаюсь выяснить, можно ли это установить с помощью свойства в camelContext.

Это то, что у меня есть, оно работает, но ... и я не могу заставить groupBy принять параметр.

мой маршрут

<!--  route on Weekends -->
    <route id="inRouteWkEndBfmt1" routePolicyRef="startPolicyWkEnd" autoStartup="false" >
    <from id="mainProcessingRouteWkEnd" ref="AsciiGatewayBackfillmt1" />
    <convertBodyTo type="java.lang.String" />
    <log message="File ${file:name} was received."/>
    <setHeader headerName="messageDateTime">
      <simple>${date:now:MM-dd-yyyy-HH:mm:ss}</simple>
    </setHeader>
    <split streaming="true" >
    <tokenize token="\n" group="50"/>
        <log message="Split line Body: ${body}"/>
        <process ref="asciiSplitterProcessor" />
        <log loggingLevel="INFO" message="Successfully sent ${file:name} to MT1 Core for Analytics Observation." />
        <to id="windowsShareTargetWkEnd" uri="file://{{target.folder}}" />   
    </split>
    <process ref="asciiCleanUp" />
 </route>

код

public void process(Exchange exchange) throws Exception {

    log.info("Ascii Splitter Processor :: start");

    String inBody = exchange.getIn().getBody(String.class);

    String fileName = (String) exchange.getIn().getHeader("CamelFileName");
    String fileSuffix = fileName.substring(fileName.lastIndexOf("."), fileName.length());
    String filePrefix = fileName.substring(0, fileName.lastIndexOf("."));
    fileName = filePrefix + "_" + cntr + fileSuffix;
    exchange.getIn().setHeader("CamelFileName",fileName);
    cntr++;
    fileName = (String) exchange.getIn().getHeader("CamelFileName");
    log.info("File being processed: " + fileName );
    log.debug("Message record: " + inBody);
    StringBuilder sb = new StringBuilder();
    Scanner sc = new Scanner(inBody);
    if ( ! hdrFlag ) {
        while ( sc.hasNextLine() ) {
            record = sc.nextLine();
            log.debug("record: " + record);
            log.debug("HEADER FLAG: " + hdrFlag);
            if ( !hdrFlag ){
                    HEADER = record + "\r\n";
                    hdrFlag = true;
                    log.debug("HEADER: " + HEADER);
            }
            sb.append(record).append("\r\n");
        }
      } else {
                sb.append(HEADER).append(inBody); 
            }
    sc.close();
    exchange.getIn().setBody(sb.toString());
    sb = new StringBuilder();

1 Ответ

0 голосов
/ 18 мая 2018

Я думаю, что это немного более изящно, чем выше. к сожалению я не на верблюде 2.9. но это работает для вспомогательной единицы работы, которую нужно объединить на стороне сервера для больших полезных нагрузок CSV, я конвертирую в Json и отправляю на сервер.

спасибо всем. надеюсь, что это поможет кому-то еще в случае использования.

    public void process(Exchange exchange) throws Exception {

    log.info("Entering Extract Header Processor ...");

        //if file is split in to multiple files modify the name with an index 
        String fileName = (String) exchange.getIn().getHeader("CamelFileName");
        String fileSuffix = fileName.substring(fileName.lastIndexOf("."), fileName.length());
        String filePrefix = fileName.substring(0, fileName.lastIndexOf("."));
        fileName = filePrefix + "_" + fileCounter + fileSuffix;
        fileCounter++;
        //fileName = filePrefix + "_" + Integer.valueOf((int)exchange.getProperty("CamelSplitSize")) + fileSuffix;  // need camel 2.9 for this to work, bummer
        exchange.getIn().setHeader("CamelFileName",fileName);
        log.info(" FILE NAME: " + exchange.getIn().getHeader("CamelFileName", fileName));
        //log.info("File Counter: " + Integer.valueOf((int)exchange.getProperty("CamelSplitSize"))); // need camel 2.9 for this to work, bummer
        log.info("File Counter: " + fileCounter ); 

        //if this is the first split body, get the header to attach to the other split bodies
        String body = exchange.getIn().getBody(String.class);       
        StringBuilder sb = new StringBuilder();

        if ( (Integer.valueOf((int)exchange.getProperty("CamelSplitIndex")) == 0 ) ) {
            List<String> serviceRecords = new ArrayList<String>(Arrays.asList(body.split(System.lineSeparator())));
            StringBuilder header = getHeader( serviceRecords );
            HEADER = header.toString();
            exchange.getIn().setBody(body);
        } else {
            sb.append(HEADER).append(System.lineSeparator()).append(body);
            exchange.getIn().setBody(sb.toString());
        }
        sb = new StringBuilder();
        log.debug("HEADER: " + HEADER);
        log.info("Exiting Extract Header Processor ... :: Finish");
  }

    public StringBuilder getHeader(List<String> serviceRecords) {
        StringBuilder sb = new StringBuilder();
        for ( int i = 0; i < 1; i++ ) {
            log.debug("record: : " + serviceRecords.get(i).toString());
            if ( i == 0 ) {
                String[] sa = serviceRecords.get(i).toString().split(",");
                for ( int j = 0; j < sa.length; ++j) {
                    if ( j != 0 ) {
                        sb.append(sa[j]).append(",");
                    }
                }
                sb.deleteCharAt(sb.lastIndexOf(",", sb.length())); 
            } else {
                break;
            }
        }
        return sb;
    }

    public void cleanHeader() {
        HEADER = "";
        fileCounter = 0;
    }

}

Маршрут

<route 
    id="core.accept.file.type.route"
    autoStartup="true" >
    <from uri="{{fileEntranceEndpoint}}" />
    <choice>
        <when>
            <simple>${header.CamelFileName} regex '^.*\.(csv|CSV)$'</simple>
            <log message="${file:name} accepted for processing..." />
            <choice>
              <when>
                <simple>${header.CamelFileName} regex '^.*\.(CSV)$'</simple>
                <setHeader headerName="CamelFileName">
                    <simple>${file:name.noext}.csv</simple>
                </setHeader>                    
              </when>
            </choice>

            <split streaming="true" >
            <tokenize token="\n" group="600" />
            <log message="Split Group Body: ${body}"/>
                <to uri="bean:extractHeader" />
                <to id="acceptedFileType" ref="pConsumer" /> 
            </split>
            <to uri="bean:extractHeader?method=cleanHeader"/>
            <!-- <to id="acceptedFileType" ref="pConsumer" />  -->
        </when>
        <otherwise>  
            <log message="${file:name} is an unknown file type, sending to unhandled repo." loggingLevel="INFO" />
            <to uri="{{unhandledArchive}}" />
        </otherwise>
    </choice>
</route>
...