Есть ли в этих двух документах тензорного потока конфликт о повторении и перемешивании? - PullRequest
1 голос
/ 25 апреля 2019

Первый документ

Преобразование tf.data.Dataset.repeat повторяет входные данные конечное (или бесконечное) количество раз; каждое повторение данных обычно упоминается как эпоха. Tf.data.Dataset.shuffle преобразование рандомизирует порядок примеров набора данных.

Перемешать перед повторением

Если преобразование в случайном порядке применяется перед повтором преобразование, то производительность может снизиться начало каждой эпохи, связанной с инициализацией внутреннего состояние преобразования в случайном порядке. Другими словами, тасование перед повторением обеспечивает более строгие гарантии заказа.

Повторите до перемешивания

Если повторное преобразование применяется до шаффла трансформации, то границы эпох размыты. То есть, некоторые элементы могут повторяться до того, как другие элементы появятся даже один раз. Повтор перед перетасовкой обеспечивает лучшую производительность,

Второй документ

Перемешать перед повторением

.Shuffle перед .repeat будет перетасовывать предметы через границы эпох (некоторые предметы будут видны дважды до того, как другие видны вообще).

Повторите до перемешивания

. Перестановка после .партии будет перетасовывать порядок партий, но не будет перетасовывать элементы между партиями.

Вопрос

В первом документе они утверждали, что если повторное преобразование применяется до преобразования в случайном порядке, тогда границы эпох размыты. То есть некоторые элементы могут повторяться до того, как другие элементы появятся хотя бы один раз.

Но во втором документе они утверждали, что .shuffle перед тем, как .repeat будет перетасовывать элементы через границы эпох (некоторые элементы будут видны дважды, прежде чем другие вообще будут видны).

Есть ли конфликт в этих буксирных документах?

...