У меня есть набор данных, который состоит из вложенных последовательностей, поэтому, например, одна точка данных выглядит так:
p1 = [[1,1,1], [2,2], [3,3,3]]
но другая точка данных может выглядеть так:
p2 = [[1,1], [2,2,2,2,2]]
Я не уверен, как сохранить списки списков в TFRecords, так как все найденные примеры сохраняют только не вложенные списки различной длины. Я планирую затем использовать padded_batch для создания трехмерных тензоров формы
[batch size, max number of lists, max number of tokens in a list]