Я пытаюсь построить систему извлечения отношений для взаимодействий между наркотиками, используя CNN, и мне нужно встраивать слова в мои предложения. План состоит в том, чтобы представить каждое слово в предложениях как комбинацию из 3 вложений: (w2v, dist1, dist2), где w2v - это предварительно подготовленное вложение word2vec, а dist1 и dist2 - относительные расстояния между каждым словом в предложении и двумя наркотиками, которые возможно связаны.
Я не понимаю, как мне подходить к вопросу о заполнении, чтобы каждое предложение имело одинаковую длину. Должен ли я дополнить токенизированные предложения некоторыми рядами строк (какой строкой?), Чтобы выровнять их длины перед любым вложением?