read_csv из списка файлов с контентом на иврите - PullRequest
0 голосов
/ 12 марта 2020

Я использую Python 3 на Windows сервере и пытаюсь импортировать в Dataframe несколько файлов CSV (с идентичной структурой). Эти файлы содержат некоторый контент на иврите, а путь к этим файлам также содержит ивритские символы.

При выполнении следующего я получаю хороший разделенный на столбцы вывод в gibberi sh (пробовал разные кодировки - не делал справка):

PATH=r'\\server_name\hebrew_folder_name'

for FILE_LIST in glob.glob(os.path.join(PATH,"**\*ABC*.csv",'r'),recursive=True):
    FILE_DF0=(pandas.read_csv(open(FILE,'r',encoding='1255'),delimiter='\t') for FILE in FILE_LIST)
    FILE_DF=pandas.concat(FILE_DF0,ignore_index=True)

FILE_DF.head(5)

Выполнение следующих действий дает читабельный вывод на иврите, но не в виде Dataframe, а не из списка файлов;

with open(os.path.join(PATH,"file_name.csv"),'r',encoding='cp1255') as FILE0:
    FILE=FILE0.read(100)
    print(FILE)

Любые предложения будут очень признательны. Я очень новичок в Python. :)

...