В то время как Tensorflow имеет большую поддержку Высокоуровневый набор данных , мой набор данных, скорее всего, является необработанным неструктурированным двоичным набором данных (например, 0x14 0x5c 0xaa 0x68 0x28 ...
), хранящимся в одном огромном файле (приблизительно около 10 ГиБ). Я думал о загрузке файла в виде целочисленного буфера потока из-за размера файла (например, Buffer([0x14, 0x5c, 0xaa, 0x68, 0x28 ...])
). Кто-нибудь знает, как загрузить такой сырой двоичный файл, как DataSet, в Tensorflow?