Проблемы с кодировкой акцентов с использованием файлов Google Colab / скачать - PullRequest
0 голосов
/ 05 июля 2019

Я использую Google Colab, чтобы делиться скриптами на python с моей командой (не спрашивайте, почему ...), и я очень расстроен, потому что часть кода, который экспортирует файл, не взаимодействует настолько, насколько кодирует. Я пытаюсь вывести CSV, который содержит некоторые акцентированные символы, и указание кодировки = 'utf-8' работает на обычной платформе, но когда я использую для загрузки виджет файлов Google Colab, происходят две вещи:

  1. Если я пытаюсь открыть CSV в Excel, акценты складываются
  2. Если я попытаюсь открыть в TextMate и сохранить его в кодировке UTF-8, Excel больше не распознает его как допустимый файл, и даже если я заставлю его открыть файл, акценты все равно будут уничтожены.

У меня есть обходной путь, просто меняя запятые на вкладки, затем вставляя в Excel из TextMate, но это раздражает, и теперь я должен научить мою команду регулярным выражениям заменять вкладки.

пробовал разные комбинации кодировок, но безрезультатно

def output_file(header_list, table_list):
outfile = 'results.csv'
with open(outfile, 'w') as file:
    for item in range(0, len(header_list)):
        try:
            file.write(f'\n{header_list[item]}\n')
            file.write(table_list[item].to_csv(header=False, index=False, encoding='Latin-1'))
        except:
            pass
files.download(outfile)

Удары появляются как Банье-де-Люшон

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...