Falcom 05 февраля 2019 0

HIVE QL.Столбец содержит данные не в формате UTF-8

Falcom / 05 февраля 2019

У меня есть таблица улья с приблизительно 10-миллионными строками.Во время проверки на основе сценариев SAS я получил сообщение об ошибке

"ОШИБКА: данные из столбца 'customer_name' в строке 1234782 набора результатов не были представлены в формате Hadoop UTF-8. Добавление -JREOPTIONS(-Dfile.encoding = UTF-8) для вызова SAS может обойти проблему.В противном случае данные должны быть исправлены в формате UTF-8.

Вопрос: Чтобы исправить данные в utf-В формате 8 нам нужно определить, в какой строке есть такие данные.

Итак, как нам определить строку со значениями, отличными от UTF-8, в столбце customer_name в кусте с использованием HQL?

...