Конфигурация для приема внутрь Друид Кафка - PullRequest
0 голосов
/ 05 февраля 2019

Я хочу настроить прием kafka druid, но даже после настройки в common.runtime.properties и добавления службы индексирования druid - kafka он все еще выдает ошибку.Пожалуйста, помогите мне с этим.Мои данные в формате csv.

{
"type": "kafka",
"spec": {
    "dataSchema": {
        "dataSource": "london_crime_by_lsoa",
        "parser": {
            "type": "string",
            "parseSpec": {
                "format": "csv",
                "dimensionsSpec": {
                    "dimensions": [
                        "lsoa_code",
                        "borough",
                        "major_category",
                        "minor_category",
                        {
                            "name": "value",
                            "type": "long"
                        },
                        {
                            "name": "year",
                            "type": "long"
                        },
                        {
                            "name": "month",
                            "type": "long"
                        }
                    ]
                },
                "timestampSpec": {
                    "column": "year",
                    "format": "auto"
                },
                "columns": [
                    "lsoa_code",
                    "borough",
                    "major_category",
                    "minor_category",
                    "value",
                    "year",
                    "month"
                ]
            }
        },
        "metricsSpec": [],
        "granularitySpec": {
            "type": "uniform",
            "segmentGranularity": "year",
            "queryGranularity": "NONE",
            "rollup": false
        }
    },
    "ioConfig": {
        "topic": "london_crime_by_lsoa",
        "taskDuration": "PT10M",
        "useEarliestOffset": "true",
        "consumerProperties": {
            "bootstrap.servers": "localhost:9092"
        }
    },
    "tuningConfig": {
        "type": "kafka",
        "maxRowsPerSegment": 500000
    }
}

}

После выполнения этой команды:

   curl -XPOST -H'Content-Type: application/json' -d @quickstart/tutorial/crime_supervisor.json http://localhost:8090/druid/indexer/v1/supervisor

Я получаю эту ошибку:

{"error":"Instantiation of [simple type, class org.apache.druid.indexing.kafka.supervisor.KafkaSupervisorSpec] value failed: dataSchema"}

1 Ответ

0 голосов
/ 05 февраля 2019

Я думаю, что это проблема с тем, как вы указали спецификацию в вашем JSON.Вы должны указать dataSchema непосредственно в своем JSON, а не в качестве дочернего атрибута spec.

. Вот формат, которому вы должны следовать:

{
   "type": "kafka",
   "dataSchema": {},
   "tuningConfig": {},
   "ioConfig": {}
}
...