Я пытаюсь прочитать не-Ascii символы из csv в pysaprk, в частности, csv содержит названия стран на испанском sh, поэтому у меня есть ESPAÑA
(ИСПАНИЯ на испанском sh), но он читает ESPA�OLA
это код, который я использую:
df = sqlContext.read.csv("path", sep=",", header=True )
Я не могу найти все кодировки, которые sqlContext.read
принимает, я пытался использовать latin-1
, но я получаю сообщение о том, что оно не поддерживается