Это точно так же.Нет разницы вообще.
Преобразование предложений в векторы индексов и их соответствие.
Важные вещи :
Не составляйте предложения, начинающиеся с 0, ваш vectors
должно быть:
vectors = [[1,2,3,4,0,0,0,0,0]
[5,6,7,5,8,0,0,0,0]]
Иметь индексы для пробелов (как минимум) и знаков пунктуации:
char_dict = {'t':1,
'h':2,
'i':3,
's':4,
'a':5,
'd':6,
'o':7,
'g':8
' ':9,
'.':10,
'c':11}
sentences = ['this is a dog', 'that is a cat.']
vectors = [
[char_dict[ch] for ch in sentence] for sentence in sentences
]
vectors = [
[1, 2, 3, 4, 9, 3, 4, 9, 5, 9, 6, 7, 8],
[1, 2, 5, 1, 9, 3, 4, 9, 5, 11, 5, 1, 10]
]