Я не знаю точно, почему я так долго тренировался с CsvDataset, но изменение моего кода, чтобы сначала импортировать данные в массив Numpy, а затем импортировать его с помощью tf.data.Dataset.from_tensor_slices
, сделало обучение примерно 10-100 раз быстрее . Еще одно, возможно, уместное изменение, за которым последовало это, заключалось в том, что набор данных больше не был вложенным во время обработки. В старой версии каждая партия была кортежем тензоров столбцов, тогда как в новой версии каждая партия была просто тензором. (Дальнейшее ускорение может быть достигнуто путем удаления преобразований, адаптированных к вложенной структуре, которые теперь применяются только к одному тензору.)