Загрузка CSV-файла в таблицу Apache Phoenix и запись строк неверных данных - PullRequest
0 голосов
/ 08 июля 2019

Я следую инструкции по ссылке ниже, чтобы загрузить данные CSV в данные Phoenix с помощью MapReduce.https://phoenix.apache.org/bulk_dataload.html

Я успешно загрузил небольшой файл.Однако, когда я попытался загрузить файл с многомиллионными записями, я получил ошибку «Недопустимые данные», и ни одна запись не была загружена.Затем я обошел ошибку, используя опцию «--ignore-errors», и загрузил файл, и, как я и ожидал, не все записи были загружены в соответствии с количеством записей в таблице.

Я где-то читал, что Phoenix или HBaseтяжело зарегистрирован.Интересно, были ли зарегистрированы эти ошибки или какая-то конфигурация Phoenix, которую мне нужно сделать, чтобы включить ведение журнала.

Кроме того, на приведенной выше странице кратко описан инструмент - org.apache.phoenix.mapreduce.CsvBulkLoadTool.Где я могу найти полную документацию?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...