У меня есть файл, в котором в качестве разделителя используется двойной канал вместо запятой или одного канала.
07||1||60||51111288||470||12647767||-1||0||-1||6||||77039144||-1||||||||||||||||||||||61807||||-1||1899-12-30 00:00:00.000||0||39||2019-03-07 17:15:56.000||1899-12-30 00:00:00.000||2019-03-07 17:23:35.000||0||0||0||-1578673||107||-1||-1||1||1||-1||-1||3||.000000||.000000||.000000||-1||.000000||-1||.000000||-1||.000000||.000000||2019-03-07 17:23:35.000||-1||-1||-1||-1||-1||-1||||||||-1||||||-1||||||1978955,2
Хотел узнать, как настроить хранилище в Apache Drill, чтобы оно могло обрабатывать двойную трубу.
"formats": {
"csv": {
"type": "text",
"extensions": [
"csv",
"CSV"
],
"delimiter": "||"
}
Если я даю двойную трубу, выдается ошибка: Please retry: error (invalid JSON mapping)
Согласно этой статье https://drill.apache.org/blog/2015/12/14/drill-1.4-released/ a linedelimiter
может иметь двойной символ, но для delimiter
ничего не упоминается