Вам необходимо преобразовать входные данные в формат tf.data
с ожидаемой схемой, чтобы вы могли сначала создать объекты, а затем обучить свою классификационную модель.
Если вы посмотрите на наборы данных склеивания, которые идут для tensorflow_datasets
ссылка вы увидите, что данные имеют указанную c схему:
dataset_ops.get_legacy_output_classes(data['train'])
{'idx': tensorflow.python.framework.ops.Tensor,
'label': tensorflow.python.framework.ops.Tensor,
'sentence': tensorflow.python.framework.ops.Tensor}
такая схема ожидается, если вы хотите использовать convert_examples_to_features
для подготовки данных готов к внедрению в вашу модель.
Преобразование данных не так просто, как, например, с pandas, и будет сильно зависеть от структуры ваших входных данных.
Например, вы можете найти здесь шаг за шагом сделайте такое преобразование. Это можно сделать с помощью tf.data.Dataset.from_generator
.