В настоящее время я работаю над проблемой в тензорном потоке, где мне нужно создать партии, в которых все тензоры в партии имеют определенное значение ключа.Если возможно, я пытаюсь использовать API набора данных.Это возможно?
Фильтр, карта, применить все операции на отдельных элементах, где мне нужен метод группировки по ключу.Я встречал tf.data.experimental.group_by_window и tf.data.experimental.group_by_reducer, которые кажутся многообещающими, но я не смог найти решение.
Возможно, было бы лучше датьпример:
dataset:
feature,label
1,word1
2,word2
3,word3
1,word1
3,word3
1,word1
1,word1
2,word2
3,word3
1,word1
3,word3
1,word1
1,word1
группировка по «ключевой» функции, максимальный размер партии = 3, предоставление партий:
batch1
[[1,word1],
[1,word1],
[1,word1]]
batch2
[[1,word1],
[1,word1],
[1,word1]]
batch3
[[1,word1]]
batch4
[[2,word2]
[2,word2]]
batch5
[[3,word3],
[3,word3],
[3,word3]]
batch6
[[3,word3]]
РЕДАКТИРОВАНИЕ: порядок каждой партии не важен, несмотря на пример