У меня есть объект dataframe от pandas, содержащий столбец с мешком слов, представляющим текст, хранящийся в виде разреженной матрицы 29881x23947 типа ''.Столбец был обработан с использованием sklearn и функции fit_transform ().
Теперь я хочу преобразовать этот Colum в 2D-тензор с помощью функции convert_to_tensor ().
x_train_tensor = tf.convert_to_tensor(x_train)
Получение ошибкиСообщение:
Ошибка типа: ожидаемая двоичная или Unicode строка
Какой формат необходим для преобразования моей матрицы в тензор?
Редактировать : распечатывает тип столбца, который он говорит:
<class 'scipy.sparse.csr.csr_matrix'>
Пример кадра данных в качестве вывода:
0 (0, 6276)\t1\n (0, 8209)\t1\n (0, 14299)\t...
1 (0, 6276)\t1\n (0, 8209)\t1\n (0, 14299)\t...
2 (0, 6276)\t1\n (0, 8209)\t1\n (0, 14299)\t...
3 (0, 6276)\t1\n (0, 8209)\t1\n (0, 14299)\t...