Как исправить это 'UnicodeEncodeError' / 'TypeError' при чтении текста для LSTM в Keras - PullRequest
1 голос
/ 01 июня 2019

Я использую код здесь командой keras для генерации текста с использованием LSTM, но я использую свои собственные текстовые данные.Я получаю эту ошибку при работе на GPU.

Я подумал, что нам нужно использовать 'utf-8', но это уже указано при чтении из текстового файла.

path = 'path/to/mytxt.txt'
with io.open(path, encoding='utf-8') as f:
    text = f.read().lower()

Я не понимаю, откуда возникла проблема. Отдыхкода точно такой же.Часть, где возникает ошибка:

def on_epoch_end(epoch, _):
    # Function invoked at end of each epoch. Prints generated text.

    start_index = random.randint(0, len(text) - maxlen - 1)
    for diversity in [0.2, 0.5, 1.0, 1.2]:

        generated = ''
        sentence = text[start_index: start_index + maxlen]
        generated += sentence
        print('----- Generating with seed: "' + sentence + '"')

Ошибка:

Файл "txt_gen.py", строка 77, в on_epoch_end

print ('----- Генерация с использованием seed: "'+ предложение +'" ')

UnicodeEncodeError: кодек' ascii 'не может кодировать символ' \ u201c 'в позиции 65: порядковый номер не находится в диапазоне (128)

ОБНОВЛЕНИЕ:

Пробовал print('----- Generating with seed: "' + sentence.encoded('utf-8') + '"'), и теперь ошибка изменилась на

TypeError: Невозможно неявно преобразовать объект 'bytes' в str

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...