Чтение ORC Spark DataFrames со специальными символами - PullRequest
0 голосов
/ 24 августа 2018

Я загружаю некоторые таблицы ORC из S3, но я полагаю, что я сталкиваюсь с некоторыми проблемами с кодировкой символов. В результирующем кадре данных символы, такие как 'á', 'â', 'ñ' и т. Д., Не будут отображаться правильно (все поля имеют тип StringType), и я не могу найти какие-либо свойства spark / sql / hive, которые могли бы иметь отношение к заключению символов , кодировки или что-то в этом роде. Кто-нибудь когда-нибудь имел дело с этим раньше?

...