Elastic Search - сложный файл Ingest - PullRequest
0 голосов
/ 01 апреля 2019

У меня есть большой документ, который изначально был взят из старой лотосной ноты.Файл выглядит следующим образом:

    Reference: 123
    Title:     My first line of text
    Notes:     This is a short description of the reference. 

               As you can see it takes up multiple lines and includes 

               multiple carriage returns

   <0x0c>

    ActionType: Save
    Reference:  345
    Title:      My second line of text
    Notes:      This is another short description of the reference: 

                As you can see it also takes up multiple lines and includes 

                multiple carriage returns

   <0x0c>

Символ <0x0c> работает как разделитель строк для каждой записи, которая была сохранена в БД.

В идеале я хотел бы сохранить эти данные в базе данных MS Access и надеялся, что упругий поиск может помочь с этим, но у меня действительно очень трудно перевести эти данные в json, xml или любой другой формат, в котором упругий поискмог бы понять, тем более, что столбцы для каждой строки неравномерны, например, ActionType может существовать в одной, но не в другой.

Я подумал, что смогу просто проанализировать текст как угодно, прежде чем : станет заголовком столбца изначение - это все после этой формулы, но до возврата каретки.

Есть ли простой способ просто импортировать эти данные в то, что может их прочитать?

...