UnicodeEncodeError: код 'ascii' c не может кодировать символы в позиции 62-11168: порядковый номер не в диапазоне (128) - PullRequest
0 голосов
/ 15 апреля 2020

Помогите мне понять, что с этим не так. Я запускаю текстовое суммирование с использованием Transformers

~ / Bart_T5-суммирование $ python app.py Не удалось найти обработчики для журнала "transformers.data.metrics" Traceback (последний вызов был последним): файл "app .py ", строка 6, из импорта преобразователей BartTokenizer, BartForConditionalGeneration, файл BartConfig" /home/darshan/.local/lib/python2.7/site-packages/transformers/init.py " , строка 42, из .tokenization_auto импортировать файл AutoTokenizer "/home/darshan/.local/lib/python2.7/site-packages/transformers/tokenization_auto.py", строка 28, из из .tokenization_xlm импортировать файл XLMTokenizer " /home/darshan/.local/lib/python2.7/site-packages/transformers/tokenization_xlm.py ", строка 27, в файле sacremoses для импорта как файл sm" /home/darshan/.local/lib/python2 .7 / site-packages / sacremoses / init .py ", строка 2, из файла sacremoses.tokenize import * Файл" /home/darshan/.local/lib/python2.7/site- packages / sacremoses / tokenize.py ", строка 16, в классе MosesTokenizer (объект): Файл" / home / darshan /. local / lib / python2 .7 / site-packages / sacremoses / tokenize.py ", строка 41, в MosesTokenizer PAD_NOT_ISALNUM = r" ([^ {} \ s.'` \, -]) ". формат (IsAlnum ), r "\ 1"

введите описание изображения здесь UnicodeEncodeError: код "ascii" c не может кодировать символы в позиции 62-11168: порядковый номер не в диапазоне (128)

...