Возникла проблема при загрузке файла HDFS в Hive - PullRequest
0 голосов
/ 02 марта 2020

Я пытаюсь записать данные в куст с помощью R Studio, для чего сначала я сохраняю данные в HDFS, а оттуда хочу вставить данные в Hive.

Данные, хранящиеся в HDFS как: ["TER0626974_achtained "," TER0630327_achtained "," TER0630520_achtained "," TER0537124_achtained "," TER0404705_achtained "]

Проблема: теперь проблема заключается в чтении этих данных из улья.

CREATE EXTERNAL TABLE dbname.table_name (
    id string
) ROW FORMAT SERDE 'org.apache.hive.hcatalog.data.JsonSerDe'
STORED AS TEXTFILE 
LOCATION "/hdfs/path/to/file";

Мы можем вставить этот результат в улей. Но при попытке прочитать, получая ниже ошибку.

archive_data <- dbGetQuery (hivecon, "SELECT * from Table") Ошибка в .jcall (rp, "I", "fetch" , шаг, блок): <br>org. apache .hive.service.cli.HiveSQLException: java .io.IOException: org. apache .had oop .hive.serde2.SerDeException: java .io.IOException: Стартовый токен не найден там, где ожидается

Может ли это быть проблемой? JSON должно начинаться с {, а не с массива ([)?

...