Проблема в том, что в этом учебнике есть несколько частей на одной странице, и каждая часть имеет собственный "Complete Example"
Первый "Complete Example"
читает текст из republic_clean.txt
, очищает его и сохраняет в republic_sequences.txt
- этосоздает последовательности с одинаковым количеством слов.
Second "Complete Example"
читает текст из republic_sequences.txt
и использует его с
sequences = np.array(sequences)
X, y = sequences[:,:-1], sequences[:,-1]
Поскольку первая часть создает последовательности с одинаковым количеством слов,этот код работает правильно.
Кажется, вы пропустили первую часть. Вы должны вернуться к первой части, чтобы узнать, как очистить текст и как создать правильный файл, который вы можете использовать во второй части.
РЕДАКТИРОВАТЬ: , если вы не можетесоздайте последовательности с одинаковым количеством слов, затем вы можете добавить пробелы к более коротким последовательностям. Код будет работать, но я не знаю, создаст ли он лучшую модель.
sequences = [['a'], ['b','c'], ['d','e','f']]
max_len = max(map(len, sequences))
sequences = [x + [""]*(max_len-len(x)) for x in sequences]
print(sequences)
Результат
[['a', '', ''], ['b', 'c', ''], ['d', 'e', 'f']]