Я пытаюсь выяснить, как преобразовать строки таким образом, чтобы их можно было использовать
для обучения модели тензорного потока / кераса для чат-бота.
Сейчас я использую это Метод:
import tensorflow as tf
import numpy as np
messages = open("messages.txt","r").readlines()
responses = open("responses.txt","r").readlines()
train_messages = []
for line in messages:
tmp1 = []
for word in line.split(' '):
tmp2 = []
for char in word:
tmp2.append(ord(char))
tmp1.append(tmp2)
train_messages.append(tmp1)
train_messages = np.array(train_messages, dtype=int)
train_responses = []
for line in responses:
tmp1 = []
for word in line.split(' '):
tmp2 = []
for char in word:
tmp2.append(ord(char))
tmp1.append(tmp2)
train_responses.append(tmp1)
train_messages = np.array(train_messages, dtype=int)
# rest of code...
Мне нужен какой-то способ, чтобы преобразовать целые слова в int
, и я понял, что код, который у меня есть, может привести к тому, что ai будет неправильно писать много слов.
Я использую официальный дистрибутив Python 3.5 в Ubuntu Linux.