Я пытаюсь встраивать тексты, используя предварительно обученные модели fastText. Некоторые пусты. Как заменить их, чтобы сделать возможным встраивание? Я думал о замене их фиктивными словами, вот так (документы, являющиеся объектом DataFrame pandas):
docs = docs.replace(np.nan, 'unknown', regex=True)
Однако на самом деле это не имеет смысла, так как выбор этого слова является произвольным и не эквивалентен наличию пустой строки.
В противном случае я мог бы связать вложение вектора 0 с пустыми строками или усредненный вектор, но я не уверен, что это имело бы смысл, так как операция вложения нелинейна.